AI“幻觉”难题破解：告别瞎蒙，AI改写新篇章

58 3 2025-09-07

OpenAI攻克大语言模型“幻觉”难题近日，《商业内幕》报道，OpenAI的研究人员宣布成功破解了大语言模型性能的一大障碍——幻觉问题。这一现象指的是模型将不准确的信息误判为事实，几乎所有主流模型都曾深受其害。 OpenAI在最新论文中指出，幻觉的根源在于训练方式过于侧重于奖励“猜测”，而非接受不确定性。这意味着模型被训练成“假装知道”，而非坦率地表达“不确定”。不同模型在应对不确定性时的表现差异显著。OpenAI上月的一篇博文中提到，Claude在面对不确定时更为谨慎，常避免错误回答。Claude的拒答率较高，可能影响其使用价值。论文指出，幻觉之所以难以消除，是因为现有评估标准奖励猜测。模型被优化成“考试型选手”，在不确定时猜测反而能提高分数。大语言模型几乎一直处于“考试模式”，将世界视为非黑即白的是非题。现实远比考试复杂，不确定性远多于确定性。研究人员强调，人类在现实生活中的挫折中学会表达不确定性的价值，而大语言模型的评估主要依赖考试，这些考试却惩罚了不确定的回答。他们认为，解决问题的关键在于重新设计评估标准。评估指标必须对齐，调整主要评分方式，避免在模型不确定时因拒答而被扣分。 OpenAI在介绍论文的博文中进一步解释说，目前广泛使用的基于准确率的评估需要更新，打分方式应当抑制“乱猜”行为。如果排行榜继续奖励侥幸的回答，模型就会不断被训练成靠猜测过关。（字数：约460字）