9.9 和 9.11,哪个大?AI 答错了——它没有真假概念

费曼讲AI

2024 年,「9.9 和 9.11 哪个大」这道小学题让 8 个主流 AI 集体翻车。它们的回答是:「9.11 更大,因为小数点后面 11 大于 9。」推理完整,语气笃定,全错。

AI 不是在回答你,它在填空。遇到高频常识,训练数据出现了几百万次,填对概率接近 100%。遇到太具体的细节、太冷门的领域、或训练截止日期之后的事,数据稀疏,模型就用听起来正确的语言把空白填上——还是用一模一样自信的语气。

最反直觉的地方:AI 的语气确定性和内容准确性完全没有关系。「水的沸点是 100°C」和「某 CEO 2026 年 Q1 财报的原话」,两句话语气一模一样——一真一假,你从语气上根本分不出来。

这不是撒谎。撒谎需要知道真相后还选择欺骗。AI 的幻觉是结构性的——它压根没有真假的概念,只有流畅度。应对方式:事实类问题核查来源,给 AI 提供真实资料而不是让它凭空生成,提示词里加上”如果不确定请说不知道”。