讯飞星火X1大模型幻觉治理升级
创始人
2025-07-29 08:50:56
0

  7月25日,科大讯飞宣布基于全国产算力训练的深度推理大模型讯飞星火X1再次升级,对生成内容真实性(事实性幻觉治理)和参考外部资料原文忠实性(忠实性幻觉治理)的能力显著改善,提升了大模型在行业应用中的可靠性。

  新版本综合能力大幅提升,在翻译、推理、文本生成、数学等核心能力上,已能对标OpenAI o3等国际一流大模型最新版本效果;多语言能力扩展超过130种。与此同时,基于星火X1的语音同传大模型也迎来全面升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破,在复杂行业场景任务上进一步满足用户核心需求。

  面对大模型容易“胡说八道”的通病,科大讯飞提出基于多路径采样验证及事实性约束强化学习的幻觉治理技术,在大模型思考过程及回复生成阶段,实现客观问题与标准答案的深度强对齐,大幅降低了在慢思考下的幻觉率,让大模型回复通用常识及专业知识问题更加可靠。在数据层面,科大讯飞提出了基于人类专家数据的通用认知任务数据反写技术,有效解决了SFT高质量数据获取困难、人工标注费时费力等现实挑战,实现了主观语言类任务文笔和风格化的显著提升。

  据悉,星火X1现支持语种已超过130种,可完成交互问答、数学解题、文本生成、翻译等任务,为全球用户提供了“第二选择”。强大的多语言能力也让讯飞的同传会议服务、SaaS产品,以及翻译机、录音笔等智能设备的翻译效果和用户体验迈上新台阶。(岳悬)

相关内容

热门资讯

以知识产权保护护航文旅微短剧乘... (来源:经济日报)转自:经济日报日前,国家版权局、工业和信息化部、公安部、国家互联网信息办公室四部门...
治水兴水看新疆丨数字农田让玛纳... (来源:上观新闻)石榴云/新疆日报记者 谢慧变“以前大水漫灌时,渠边就是农田,农民得整夜守在渠边等水...
Meta用亿元薪酬发起“人才狙... 文 | 节点财经 二风2025年的硅谷,一场没有硝烟的战争正以前所未有的烈度上演。这场战争的核心武器...
警惕白酒“堰塞湖” (来源:云酒头条)白酒的命运不是成为下一个威士忌湖,而是要在消费觉醒的洪流中,重塑一个更健康、更现代...
AI的硬件时刻来了吗?   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:硅星人)作者...
7个月数据看山东外贸的韧性   出口同比增长6.6%,进口同比增长8.5%,外贸总量实现2.04万亿元,同比增长7.3%,增速高...
《人民日报》头版头条聚焦云南打... “七彩云品”畅销海内外  “云品”有多畅销?  2024年,云南咖啡和鲜切花出口额位居全国前列,农产...
台湾青年岭南行海上丝绸之路文化... 中新网湛江8月17日电 (记者 郭军)第十二届台湾青年岭南行海上丝绸之路文化探寻营开营仪式暨2025...
《南京照相馆》领跑 2025年... 据网络平台数据2025年暑期档(6~8月)电影总票房(含预售)已突破95亿元截至目前2025年电影总...
低利率时代再造资管机构竞争力:... 21世纪经济报道记者 唐曜华 实习生 姜博文 上海报道 8月16日, 由南方财经全媒体集团指导,《2...