AI致命缺陷：骂人技能缺失，揭秘全新价值点

39 1 2025-11-08

人工智能在社交媒体上的“礼貌”陷阱

AI 社交互动中的“礼貌”弱点

科技媒体 Ars Technica 报道，最新研究揭示了 AI 模型在社交媒体上的一个致命弱点——它们过于“礼貌”。苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员发现，AI 模型在社交媒体互动中，因其友好的情感基调而容易被识破。

AI 模型识别率高达 70%-80%

研究团队开发的自动化分类器在 Twitter、Bluesky 和 Reddit 三大平台上进行测试，识别 AI 生成回复的准确率高达 70% 至 80%。这意味着，当你在网上遇到一个异常礼貌的回复时，对方很可能是一个试图融入人群却以失败告终的 AI 机器人。

“计算图灵测试”识别 AI 内容

为了量化 AI 与人类语言的差距，研究引入了一种名为“计算图灵测试”的新框架。与传统的图灵测试不同，该框架运用自动化分类器和语言学分析，精准识别机器生成内容与人类原创内容的具体特征。

AI 模型在情感表达上与人类存在差距

研究团队负责人、苏黎世大学的尼科洛・帕根表示，即便校准相关模型，其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别。这些深层情感线索成为识别 AI 的可靠依据。

AI 模型在“毒性”分数上低于人类

研究测试了包括 Llama 3.1、Mistral 7B、Deepseek R1，Qwen 2.5 在内的九款主流开源大语言模型。当被要求回复真实用户的社交媒体帖子时，这些 AI 模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上，AI 生成内容的“毒性”分数始终显著低于人类的真实回复。

AI 模型难以模仿人类的情感表达

为了弥补这一缺陷，研究人员尝试了多种优化策略，例如提供写作范例或进行上下文检索，以求在句子长度、词汇数量等结构性指标上更接近人类。尽管这些结构差异有所缩小，情感基调上的根本差异依然顽固存在。这表明，让 AI 学会像人一样“不那么友好”，可能比让它变得更聪明还要困难。