我国科研机构主导的大模型成果首次在Nature发表
创始人
2026-01-29 18:48:50

中国青年报客户端讯(中青报·中青网记者 尹希宁)1月28日,智源多模态大模型成果“通过预测下一个词元进行多模态学习的多模态大模型”上线国际顶级学术期刊Nature。这是我国科研机构主导的大模型成果首次在Nature正刊发表。

2018年以来,GPT采用“预测下一个词元(Next-token prediction)”的自回归路线,实现了语言大模型重大突破,开启了生成式人工智能浪潮。

而多模态模型主要依赖对比学习、扩散模型等专门路线,自回归路线是否可以作为通用路线统一多模态?一直是未解之谜。智源这项成果表明,只采用自回归路线,就可以统一多模态学习,训练出优秀的原生多模态大模型,对于确立自回归成为生成式人工智能统一路线具有重大意义。

Nature编辑点评,Emu3仅基于“预测下一个词元”,实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能可与使用专门路线相当,这一成果对构建可扩展、统一的多模态智能系统具有重要意义。

记者从智源研究院了解到,Emu系列模型自2022年启动研发以来,围绕“原生多模态”这一核心技术主线持续迭代,每一个版本都在关键能力与方法论上实现了实质性突破。

1月28日,智源多模态大模型成果上线国际顶级学术期刊Nature。期刊截图

来源:中国青年报客户端

相关内容

热门资讯

【两会热词追踪】寻梦香格里拉 ...   提到“云南礼物”,你会想到什么?  “我最先想到的是青稞。”谈起自己熟悉的产业,省人大代表、德钦...
半导体板块盈利能力显著改善 精... 1月30日晚间,精测电子发布2025年度业绩预告。公司预计2025年归属于上市公司股东的净利润为80...
激活国展商圈消费活力!香河园“... 转自:北京青年报客户端香河园“家乡年味大集”来啦!被誉为朝阳区北三环首席“菜篮子”的“柒号市集”商业...
多地GDP数据密集发布,“数字... 近日,全国多地陆续公布2025年经济数据“成绩单”:山东GDP首破10万亿元,江苏首破14万亿元,北...
英国首相斯塔默访沪:“机遇正在... (来源:中国台湾网)转自:中国台湾网  新华社上海1月31日电(记者唐斯琦)“‘盲人摸象’象征着世界...