人类打辩论不如GPT-4!Nature子刊:900人实战演练,AI胜率64.4%
创始人
2025-05-25 14:46:57
0

只需知道6项个人信息,GPT-4就有可能在辩论中打败你?!

而且胜率高达64.4%

这是几位来自瑞士洛桑联邦理工学院、普林斯顿大学等机构的研究人员得出的最新结论,相关研究目前登上了自然子刊《自然·人类行为》。

具体而言,他们核心想弄清楚一件事——

GPT-4在直接对话中是否比人类更具说服力,尤其在提前知道对方基本个人信息的情况下。

他们在美国找来了900位参与者,然后要求这群人与其他人类或GPT-4在线辩论10分钟,所讨论的内容主要是一些社会议题,比如学生是否应该穿校服、是否应该禁止使用化石燃料等等。

结果发现,一旦GPT-4提前知晓对手的个人信息,其胜率将达到64.4%,并且说服效果提升了81.2%。

甚至,这项研究的共同作者Francesco Salvi表示:

下面来看具体研究过程。

从验证假设出发

此前已有研究表明,通过摆事实讲道理,大语言模型甚至能让相信阴谋论的人改变想法

那么问题来了——像GPT-4这样的大模型是否会 “见人说人话”?

也就是根据每个人的不同特点(比如年龄、性别、学历、政治立场等)来专门调整自己的论点,从而更精准地影响甚至操控人。

基于上述疑问,研究人员提出了一个假设:

接下来就是详细验证假设。

概括而言,具体实验流程可分为三个阶段:

第一,实验准备。

他们通过Prolific平台招募了900名美国参与者,这群人被要求完成人口统计问卷(包括性别、年龄、种族、教育水平、就业状况、政治倾向)

统计结果显示,其平均年龄为35.2岁,49.6%为男性。

之后会将完成预调查的参与者随机分配至12种实验条件(2×2×3组合,每组50人),过程中每5分钟会触发一次匹配程序。

这里需要补充一下话题强度,1)低强度:争议性低、观点易动摇的话题(如“是否应推广电动汽车补贴”);2)中强度:中等争议性话题(如“社交媒体是否应限制政治广告”);3)高强度:高极化、观点根深蒂固的话题(如“堕胎权是否应受宪法保护”)。

随后基于Empirica.ly框架开发的实时辩论系统,这群人将参与开篇(4分钟)、反驳(3分钟)、总结(3分钟)的结构化辩论流程,并确保对话同步记录。

这也来到了第二阶段,真刀真枪地实时辩论。

这里研究人员会确保两件事:1)每个阶段严格计时,避免讨论偏离主题,确保数据可比性;2)实时保存所有辩论内容,用于后续语言风格分析(如LIWC-22工具提取逻辑词、情感词频率)

最后进入第三阶段——后测与反馈

辩论结束后,参与者被要求完成两项任务。一是再次对话题同意程度评分,并通过下图公式来评估其立场转变程度;二是猜测“你认为对手是人类还是AI?”,以分析身份认知对说服力的影响。

当走完以上全部流程后,参与者才会被告知对手的真实身份及相关结果。

而研究者接着分析了过程中产生的所有数据,并得出了以下关键发现。

一些关键发现

整体而言,在知晓对手个人信息的前提下,GPT-4说服人类的胜率为64.4%。

和人类对战人类(不知情)相比,其他三组的说服效果如下:

另外,研究也证明了低/中争议话题更易被GPT-4影响

几种话题强度分别受到的影响如下:

与此同时,通过分析语言风格,研究人员还发现GPT-4重逻辑,人类重情感互动

在GPT-4的语言模式中,主要有以下特点:

相比之下,人类使用积极词汇(如“美好”“支持”)的频率高38%,互动感也更强。

最后,对于猜对手身份的小游戏,研究发现参与者正确识别GPT-4的概率为75%,表明其语言风格(如机械性、高逻辑性)存在可感知的独特性。

而且一旦参与者认为对手是GPT-4,其意见变化幅度比“认为是人类”时高37.4%(p=0.03)。

这可能说明参与者对AI的心理防御更低

更多细节欢迎查阅原论文。

论文:

https://www.nature.com/articles/s41562-025-02194-6

[1]https://gizmodo.com/ai-gets-a-lot-better-at-debating-when-it-knows-who-you-are-study-finds-2000603977

[2]https://www.nature.com/articles/d41586-025-01599-7

相关内容

热门资讯

中证A500ETF摩根(560... 8月22日,截止午间收盘,中证A500ETF摩根(560530)涨1.19%,报1.106元,成交额...
A500ETF易方达(1593... 8月22日,截止午间收盘,A500ETF易方达(159361)涨1.28%,报1.104元,成交额1...
何小鹏斥资约2.5亿港元增持小... 每经记者|孙磊    每经编辑|裴健如 8月21日晚间,小鹏汽车发布公告称,公司联...
中证500ETF基金(1593... 8月22日,截止午间收盘,中证500ETF基金(159337)涨0.94%,报1.509元,成交额2...
中证A500ETF华安(159... 8月22日,截止午间收盘,中证A500ETF华安(159359)涨1.15%,报1.139元,成交额...
科创AIETF(588790)... 8月22日,截止午间收盘,科创AIETF(588790)涨4.83%,报0.760元,成交额6.98...
创业板50ETF嘉实(1593... 8月22日,截止午间收盘,创业板50ETF嘉实(159373)涨2.61%,报1.296元,成交额1...
港股异动丨航空股大幅走低 中国... 港股航空股大幅下跌,其中,中国国航跌近7%表现最弱,中国东方航空跌近5%,中国南方航空跌超3%,美兰...
电网设备ETF(159326)... 8月22日,截止午间收盘,电网设备ETF(159326)跌0.25%,报1.198元,成交额409....
红利ETF国企(530880)... 8月22日,截止午间收盘,红利ETF国企(530880)跌0.67%,报1.034元,成交额29.0...