大模型测评报告:深度思考能力有待提升,近五成受访者认为一般
创始人
2025-07-10 19:32:34

转自:贝壳财经

新京报贝壳财经讯(记者韦英姿 韦博雅)7月10日,在2025贝壳财经年会主题论坛“建设‘开源’之都:智AI未来,生态共澎湃”上,新京报AI研究院联合中国经济传媒协会发布第二期《中国AI大模型测评报告——大模型赋能传媒行业使用与满足研究》(下称:报告)。报告显示,对于大模型深度思考能力在媒体工作上的表现,受访者持中等偏上态度(即:一般、较为满意、非常满意)。

其中,46.41%的受访者认为大模型深度思考能力一般,41.18%的受访者较为满意,仅有5.23%的受访者表示非常满意。此外,7.19%的受访者满意程度处于偏下(即:不太满意、很不满意)。

对于大模型解答专业领域知识的能力,受访者们基本满意,认为其“完全无法回答”的人数占比已不足1%。与去年相比,认为大模型“完全无法回答”“大部分时间不能准确回答专业知识提问,事实或逻辑错误出现频率高”“偶尔能够回答专业知识提问”的受访者比例均有所下降。其中,认为“完全无法回答”的受访者比例降幅最大,与去年相比减少7.57个百分点。

编辑 王进雨

校对 卢茜

相关内容

热门资讯

几内亚当选总统敦布亚宣誓就职 来源:新华网新华社科纳克里1月17日电(记者张健)几内亚当选总统马马迪·敦布亚17日在首都科纳克里宣...
国际论坛:高市早苗狂言暴露日本... 转自:人民日报原标题:高市早苗狂言暴露日本危险战略走向(国际论坛)日本如果在错误道路上越走越远,可能...
A股冰火两重天!当宽基指数估值...   近期,科创100、科创50、中证2000等指数的估值均超过150倍。管理层上调证券融资保证金最低...
12306购票页面出现“雪”字... 最近部分旅客购买东北地区的车票时发现有的车次后面带有“雪”字这是什么意思?今年1月15日起东北地区部...
小剧场戏剧《一个人的旅行》:打... 一位灵魂送货员正在搬运装满人生记忆的行李箱,却发现它重如千钧,纹丝不动。于是送货员施展魔力,探究一位...