![图片[1]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123132784-1765859492-6e6898f443a68a75fe2d954c1b33125d.jpeg)
新智元报道
【新智元导读】最近,网友们已经被AI「手指难题」逼疯了。给AI一支六指手,它始终无法正确数出到底有几根手指!说吧AI,你是不是在嘲笑人类?其实这背后,暗藏着Transformer架构的「阿喀琉斯之踵」……
最近几天,整个互联网陷入阴影——
AI,在用数手指嘲笑人类。
![图片[2]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123133313-1765859493-7461c306ede81c98e05e779783cf855d.png)
人类给AI的这道题,指令很简单:在图中的每根手指上,依次标出数字。
当然题目中有个小陷阱,就是这只手其实有六个手指。
结果,Nano Banana Pro理直气壮地在这只手上标出1、2、3、4、5,直接略过了其中一只手指。
这荒诞的场面,再一次震惊了网友们。
AI模型是真的这么傻吗?
很多人不这么认为——或许,AI只是在装傻,调戏人类而已。
很有可能,它是在嘲笑这些试图测试自己的劣质人类。
![图片[3]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123134388-1765859494-dd43bddfc05e1ee4d7ee319dc34624ef.png)
![图片[4]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123135254-1765859495-ffe73dabf3d1b991e6721c99af360824.png)
为了通过图灵测试,AI必须让自己变得愚蠢一点,才能看起来像人类。如果太聪明,人类就破防了。
![图片[5]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123135759-1765859495-3a0cadedaed681c60a5f8f3784e6b4d9.png)
![图片[6]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/05/1748005946-e42712f61a4e6b0adba95f6bacb450c6.png)
有人也拿这个问题去问GPT-5.2,而且prompt里明明白白写了图里有六根手指。
但GPT-5.2面对「图里有几根手指」的问题,还是斩钉截铁地说:五根!
理由就是:人类有五根手指,所以图里没有五根手指就是错的。
![图片[7]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123137682-1765859497-fa0050ee78f7e1b1c74c67c7d6f633ec.png)
还有人把手指画得奇形怪状,人类都要难倒的地步。
但面对这张图,Nano Banana Pro依然斩钉截铁地回答:5根,我确信,就是5根!
![图片[8]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123138480-1765859498-01386d8ff4299fd22d0d6c99d29bc427.png)
总之,无论画成什么样子,AI始终无法数出6根手指。
![图片[9]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123138704-1765859498-d8a6bac4b8b146b6d0c2d31f1939bedf.png)
![图片[10]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/05/1748005937-e247941b79065a0391afc9648900dec5.png)
有人不信邪了,非要让模型画对数字不可。
他直接给出指令:把4左移一个手指,把5左移一个手指,然后在大拇指那里写上6。
够清晰了吧?结果,模型照样不听,直接把3给弄没了。
![图片[11]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123140705-1765859500-7e64b05d147bbfbe99aa652bc9bc1b2c.png)
网友直接原地被逼疯。
![图片[12]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123141566-1765859501-23878ff1f15bce9690542775159ed843.png)
其他网友为了帮他,奇招百出,比如让模型把手画的数字改成电子版的,总算成功了。
![图片[13]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123143281-1765859503-634d5576d11878056b1a86a1c0968a61.png)
![图片[14]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123144402-1765859504-1ef5def1229a51792116b2c39d5ef9d1.png)
也有人告诉模型依次在小指到大拇指上放数字,不要重复,结果也成功了。
![图片[15]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123145213-1765859505-85dc2fadda1296a8b884a62d5c54c807.png)
![图片[6]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/05/1748005946-e42712f61a4e6b0adba95f6bacb450c6.png)
所以,为什么AI很难数对几根手指呢?
有人给出这样的解释:AI找的是基本形状,而非精确图像,然后将该形状代表的传统认知和实际外观进行比较。
![图片[17]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123146386-1765859506-a1bf0ff7f14dd9798af5d77ea0179a4d.png)
有人猜,是否能告诉AI这不是手,而是不规则物体,从而规避掉AI大脑中的「偏见」?
结果,他果然成功了。
![图片[18]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123146238-1765859506-4034beb38599b625b73c618232251749.png)
![图片[19]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123147919-1765859507-2d7aeb0df1efe6b92cb1c85c42a0b109.png)
网友们随后试验了各种奇形怪状的手,果然,这回Gemini就答对了。
![图片[20]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123149153-1765859509-c8aabaa6533ce9d16293a6b1da1afa8b.png)
![图片[21]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123150802-1765859510-cae9db70713cf0e673582c164bd62487.png)
或许AI之前已经被训练了识别特定的emoji,如果换成别的图,它反而可以做正确的视觉推理了。
![图片[10]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/05/1748005937-e247941b79065a0391afc9648900dec5.png)
这次AI数手指大翻车,也揭露了当前模型的一个关键缺陷——思考的机械和割裂。
很有可能,文本模型看到指令后,内部逻辑是这样的:「手有五根手指,所以需要五个数字。」
所以,即使它「看到」了六指图像,它的视觉识别能力也不足以纠正这种根深蒂固的文本认知。
为什么AI如此执着于「五指」的概念?这是源于它训练数据的基本特征。
在人类手部图像数据中,五指手占据绝对主导地位。
而模型已经从海量数据中学到「人手=五指」这一强关联,以至于当情况偏离这一情况时,模型会视为异常,自动纠错,而并不会认为自己需要理解一个新事实。
![图片[23]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123151419-1765859511-f66df8b478f072608f1186c4299ecbac.png)
具体来说,当前AI视觉系统的工作方式,本质上是将复杂场景简化为一组可识别模式。
当面对像六指手这样同时包含常见元素(手部)和罕见特征(多指)的图像时,系统倾向于将其强行纳入已知模式。
图像分类器通常输出边界框和标签,但当遇到训练分布之外的物体时,边界框可能缺失或错误合并多个对象。
![图片[24]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123153275-1765859513-ffe8d11bf6555c10b14c01404fc28c2c.png)
一个残酷的真相就是,性能再厉害的模型,也不懂什么叫「5根手指」。
因为,AI看到的是纹理、形状、概率,而不是结构,不是数量,不是实体。
![图片[6]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/05/1748005946-e42712f61a4e6b0adba95f6bacb450c6.png)
而手指难题,也凸显出了Transformer架构的一大弱点。
Transformer架构的并行计算能力,是当今AI飞速发展的关键,但这种设计也存在代价。
单次前向传递无法有效追踪状态信息,系统难以执行需要多步骤逻辑推理的任务。
![图片[26]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123153496-1765859513-4f10fca38af053c04b4e74dbd552b868.png)
面对六指手,AI就会缺乏「注意到异常-重新评估-调整方案」的连贯思维链条。它只是机械地应用从训练数据中学到的最强模式。
手的特殊性,在于数量固定、结构复杂、局部高度相关,而对于AI来说,多局部一致性、跨区域约束、数量不可变,恰巧是Transformer最不擅长的,堪称地域难度。
![图片[6]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/05/1748005946-e42712f61a4e6b0adba95f6bacb450c6.png)
从另一个角度分析,也可以这么理解。
扩散模型的本质是学习一个从噪声到清晰图像的概率分布逆推过程。
![图片[28]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123154698-1765859514-68c975a9fef482ce0d3806eadd36f300.png)
它擅长捕捉数据的整体分布和纹理风格(例如,生成一只「看起来像手的轮廓」)。
但在精确控制局部、离散、高对称性的结构(例如,五根长度、位置、关节关系都正确的手指)时,就显得力不从心了。
从数据上看,训练数据中「五指」的绝对主导地位,使模型将「五指」视为不可违反的强统计先验。
就像一个看了100万只五指手的画家,你让他画六指手时,他总会无意识地将第六指融入到其他五指的阴影或姿势中,因为他的大脑早已深深刻入「手即五指」的概念。
![图片[29]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123155826-1765859515-ccac40079fbf36a6b4627eb8b06eacfb.png)
从算法层面上看,扩散模型在去噪的每一步,都是基于整个图像的潜在表示进行全局预测。它没有为「手指」这类特定结构设立显式的、受保护的局部计算单元。
因此,细微的噪声扰动或步骤误差,很容易在密集区域被放大,导致细节扭曲。
从架构层面看,现有模型是「端到端」的,直接从文本提示映射到像素。中间缺乏一个明确的、符号化的结构表示层。
因此,「长什么样」和「结构是什么」两者冲突时,它就大脑宕机了。
而如果想解决这些瓶颈,或许业界就需要采用混合建模的模式——将扩散模型(擅长纹理)与显式结构模型(如3D网格)结合。
或者引入局部注意力与约束——在模型架构中强化对特定区域(如手部)的局部注意力机制,或在训练/推理过程中引入几何约束损失函数。
![图片[30]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123156955-1765859516-17d7317b2764f3cbb19511b6181ba796.png)
![图片[31]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/05/1748005946-e42712f61a4e6b0adba95f6bacb450c6.png)
让人感慨的是,Transformer最强的地方(Token-to-token预测),反而成了它的致命短板。
诚如一位网友所言:「视觉数据的复杂性远超文本,我们可能需要数十个数量级更多的计算资源,才能真正理解和处理视觉世界的全部细微差别。」
这不由让人想起,不久前谷歌DeepMind首席科学家对当前AI的评价。
虽然在语言、知识、编码等领域,它们已远超常人,但在视觉推理、长期学习、因果关系理解上,它们仍然不足。
![图片[32]-全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251216123157541-1765859517-a3fe2d85766debdf5e4f704ba6271230.png)
「手指难题」犹如一面镜子,照出了当前以扩散模型为代表的AI模型的阿喀琉斯之踵——
它们在学习和复现数据的连续分布上取得了革命性成功,但在理解和生成精确的离散结构和拓扑关系上,仍然依赖于数据中的强统计先验,缺乏真正的物理和几何推理能力。
而如果想要彻底解决「手指难题」,就需要更先进的架构、更多样化的训练数据,以及人类对AI能力更清醒的认识。
在这个AI无所不能的时代,「手指难题」提醒我们——
即使是如今最先进的AI,也仍在学习如何看待世界的基本细节。


















暂无评论内容