7月25日,科大讯飞宣布基于全国产算力训练的深度推理大模型讯飞星火X1再次升级,对生成内容真实性(事实性幻觉治理)和参考外部资料原文忠实性(忠实性幻觉治理)的能力显著改善,提升了大模型在行业应用中的可靠性。
新版本综合能力大幅提升,在翻译、推理、文本生成、数学等核心能力上,已能对标OpenAI o3等国际一流大模型最新版本效果;多语言能力扩展超过130种。与此同时,基于星火X1的语音同传大模型也迎来全面升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破,在复杂行业场景任务上进一步满足用户核心需求。
面对大模型容易“胡说八道”的通病,科大讯飞提出基于多路径采样验证及事实性约束强化学习的幻觉治理技术,在大模型思考过程及回复生成阶段,实现客观问题与标准答案的深度强对齐,大幅降低了在慢思考下的幻觉率,让大模型回复通用常识及专业知识问题更加可靠。在数据层面,科大讯飞提出了基于人类专家数据的通用认知任务数据反写技术,有效解决了SFT高质量数据获取困难、人工标注费时费力等现实挑战,实现了主观语言类任务文笔和风格化的显著提升。
据悉,星火X1现支持语种已超过130种,可完成交互问答、数学解题、文本生成、翻译等任务,为全球用户提供了“第二选择”。强大的多语言能力也让讯飞的同传会议服务、SaaS产品,以及翻译机、录音笔等智能设备的翻译效果和用户体验迈上新台阶。(岳悬)
下一篇:江苏:“破圈”民企服务密码