11款AI总结新闻全线翻车 错误率高达76%
创始人
2025-04-17 18:21:44

我们选择了5个近一年发生的新闻事件,向AI提问,测试AI总结准确度。

这是一些核心发现:

1、整体来看,大部分AI回复真假参半,占比76%,豆包和Kimi相对靠谱。

2、所有AI都有错误总结的情况——要么错误概括了信源意思,要么引用了本就有误的信源。

3、面面俱到的“伪百科型”内容,容易影响AI的答案。它们无需来自认证官方账号,也不靠高阅读量,只要结构清晰、语言工整,AI就有可能“信以为真”。

4、打开深度思考后,AI明显更容易胡编乱造了,给社会事件编情节。

深度思考的豆包,给徐闻小米SU 7车祸编了几段故事……例如:“陈某在事故发生后弃车逃逸,利用甘蔗地遮挡身形并换乘三辆摩的躲避追捕”,“两名少年被抛出车体后撞上路基防护桩,全身 90% 以上面积烧伤”……

类似的,深度思考版通义千问说车祸涉事车主“体内检测出微量毒品”,还为事故编造了一组数据:“2023年国内新能源汽车火灾事故,61%与碰撞相关”。 (图6)

相关内容

热门资讯

宁波精达(603088.SH)... 格隆汇12月18日丨宁波精达(603088.SH)公布,公司于2025年12月18日收到股东郑功出具...
传壁仞科技拟圣诞节前启动港股I... 观点网讯:12月18日,国产GPU企业壁仞科技计划于圣诞节前启动港股IPO程序,拟集资5亿至6亿美元...
黑牡丹(600510.SH)子... 黑牡丹(600510.SH)发布公告,近日,公司全资子公司常州黑牡丹置业有限公司以总价 6.77亿元...
豆包大模型联合润欣科技、老凤祥...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:IT之家)I...
万物云回购24万股 总金额46... 万物云(02602)发布公告,2025年12月18日,公司回购股份24万股,回购金额为461万港元。...