高考数学140+,英语作文盲评第一……这款大模型7月将迎升级
创始人
2025-06-10 14:38:23

转自:上观新闻

2025高考方才落下大幕,其间,AI大模型也迎来了一场“被动大考”。在这场比拼中,讯飞星火表现亮眼:据三方权威媒体评测显示,讯飞星火X1在语文作文的综合得分,位列主流大模型榜首;在英语作文盲评中,获得第一;数学测评中,讯飞星火成为仅有的两个整卷得分突破140分的大模型之一。

6月9日,科大讯飞成立26周年之际,董事长刘庆峰透露,星火X1升级版将于7月推出

两年前,AI大模型刚开始做高考数学题的时候,洋相百出,被调侃“强如大模型,不识一二三四五”。短短两年,大模型在高考数学中已能轻松达到一个优秀学生的水平。为什么70B模型在高考中表现优秀?新民晚报记者了解到,科大讯飞在原有的技术优势基础上,提出了三大创新点:第一,国内首发基于快慢思考的统一模型训练推理方法;第二,提出结合评语模型和细粒度反馈的强化学习技术;第三,研发国产平台强化学习算法包,实现了全国产化算力深度推理模型训练效率优化。

“我们要有一桶水,才能倒出一碗水。”刘庆峰表示,科大讯飞做教育不仅要让AI会答题、能评分,更要实现因材施教、五育并举。通过AI批改、推荐等个性化场景,让每个孩子都能找到适合自己的学习路径,并关注创造力、心理健康和全面发展。

在技术路线选择上,刘庆峰表现出坚定态度。他坦言,相比使用英伟达等海外算力,基于国产算力开展大模型训练和算法创新存在诸多挑战,需要增加移植适配、性能调优、对比验证等额外步骤和额外算力。“基于国产算力的所有新算法的研发会慢三个月。三个月,在今天这个你追我赶的时代,是不得了的差别。”他告诉记者,“讯飞要坚定不移地走自主可控之路!如果讯飞不付出,中国的算力支撑不了深度推理模型的训练!基于国产算力的新算法研发,会慢一些,但不会矮!”

正在举行的大阪世博会也有科大讯飞的身影——作为中国馆唯一大模型展项,科大讯飞带来的支持中、日、英三语实时交互的“AI孙悟空”成为世博会上的“科技网红”。开馆50多天,大模型互动4万+次,每分钟至少完成1次讲解+交互。

刘庆峰透露,在高考和世博会等场合表现不俗的星火X1,将在7月发布升级版。

“2025还有一个时代特征,是全民AI的开启之年。”数据显示,截至2024年底,中国生成式人工智能用户已达2.49亿,占全国人口17.7%,“科大讯飞也要抢占AI时代的根红利,做到自主可控、通专结合、软硬一体、行业深耕,探索大模型和具身智能的天花板,做好底座大模型和专业模型,真正推进时代进步。”

创业26年,从语音合成、语音识别到机器翻译、再到认知智能和大模型,刘庆峰坦言科大讯飞走着“弯曲的直线”,“事物发展规律是波浪式锯齿式前进的,没有一蹴而就的成功,26年如一日坚持人工智能主赛道,源于热爱的初心。”

原标题:《高考数学140+,英语作文盲评第一……这款大模型7月将迎升级》

栏目编辑:王蕾 图片来源:采访对象供图

来源:作者:新民晚报 郜阳

相关内容

热门资讯

今年我省粮食产量达515.56... (来源:辽宁日报)转自:辽宁日报 图为在中储粮(盘锦)储运有限公司,装运粮食的重型卡车排起长队...
国家发展改革委部署促进投资止跌... (来源:辽宁日报)转自:辽宁日报 新华社北京12月13日电 (记者魏玉坤) 记者13日从全国发展和改...
江苏省实施《中华人民共和国森林... (来源:新华日报) 目 录 第一章 总则 第二章 森林、林木和林地权属管理...
姜堰数字化产品讲“活”理论 (来源:新华日报) □ 本报记者 卢佳乐 通讯员 姜宣 “王教授,您约我‘喝茶论道’,...
联合国维和部队在苏丹遇袭 6人... 转自:财联社【联合国维和部队在苏丹遇袭 6人死亡】财联社12月14日电,当地时间13日,苏丹武装部队...