9.9 和 9.11，哪个大？AI 答错了——它没有真假概念

2026年5月3日

费曼讲AI

2024 年，「9.9 和 9.11 哪个大」这道小学题让 8 个主流 AI 集体翻车。它们的回答是：「9.11 更大，因为小数点后面 11 大于 9。」推理完整，语气笃定，全错。

AI 不是在回答你，它在填空。遇到高频常识，训练数据出现了几百万次，填对概率接近 100%。遇到太具体的细节、太冷门的领域、或训练截止日期之后的事，数据稀疏，模型就用听起来正确的语言把空白填上——还是用一模一样自信的语气。

最反直觉的地方：AI 的语气确定性和内容准确性完全没有关系。「水的沸点是 100°C」和「某 CEO 2026 年 Q1 财报的原话」，两句话语气一模一样——一真一假，你从语气上根本分不出来。

这不是撒谎。撒谎需要知道真相后还选择欺骗。AI 的幻觉是结构性的——它压根没有真假的概念，只有流畅度。应对方式：事实类问题核查来源，给 AI 提供真实资料而不是让它凭空生成，提示词里加上”如果不确定请说不知道”。