AI“幻觉”难题破解:告别瞎蒙,AI改写新篇章
58
3
OpenAI攻克大语言模型“幻觉”难题 近日,《商业内幕》报道,OpenAI的研究人员宣布成功破解了大语言模型性能的一大障碍——幻觉问题。这一现象指的是模型将不准确的信息误判为事实,几乎所有主流模型都曾深受其害。 OpenAI在最新论文中指出,幻觉的根源在于训练方式过于侧重于奖励“猜测”,而非接受不确定性。这意味着模型被训练成“假装知道”,而非坦率地表达“不确定”。 不同模型在应对不确定性时的表现差异显著。OpenAI上月的一篇博文中提到,Claude在面对不确定时更为谨慎,常避免错误回答。Claude的拒答率较高,可能影响其使用价值。 论文指出,幻觉之所以难以消除,是因为现有评估标准奖励猜测。模型被优化成“考试型选手”,在不确定时猜测反而能提高分数。大语言模型几乎一直处于“考试模式”,将世界视为非黑即白的是非题。现实远比考试复杂,不确定性远多于确定性。 研究人员强调,人类在现实生活中的挫折中学会表达不确定性的价值,而大语言模型的评估主要依赖考试,这些考试却惩罚了不确定的回答。 他们认为,解决问题的关键在于重新设计评估标准。评估指标必须对齐,调整主要评分方式,避免在模型不确定时因拒答而被扣分。 OpenAI在介绍论文的博文中进一步解释说,目前广泛使用的基于准确率的评估需要更新,打分方式应当抑制“乱猜”行为。如果排行榜继续奖励侥幸的回答,模型就会不断被训练成靠猜测过关。 (字数:约460字)
![]()
![]()
数码宝贝物语新作M站9.1高分!创新玩法带你领略游戏巅峰体验
沙特基金豪掷700亿现金,华纳收购案震撼来袭,改写游戏产业格局!
《七龙珠》电光炸裂!ZERO,双平台锁帧30帧,全新视觉盛宴震撼来袭!
锐龙9 9955HX vs Ultra9 275HX:谁是游戏本处理器王者之选?