智元机器人姚卯青:不做大模型,机器人是没有未来的
创始人
2025-03-10 19:26:18
0

界面新闻记者 | 李如嘉

界面新闻编辑 | 文姝琪

3月10日,智元机器人发布首个通用具身基座模型——智元启元大模型(Genie Operator-1),提出了Vision-Language-Latent-Action (ViLLA) 架构该架构由VLM(多模态大模型) + MoE(混合专家)组成,其中VLM借助大量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助真机数据获得精细的动作执行能力,三者相结合,实现了可以利用人类视频学习,完成小样本快速泛化

智元称,该模型可以降低具身智能门槛,并已经成功部署到智元多款机器人本体

智元具身研究中心常务主任任广辉对界面新闻介绍,现有具身模型面临多个落地困境,包括泛化性差,到新场景时成功率大幅下降;扩展新任务时需要大量数据,落地成本高;不同本体的数据无法共用,数据成本高;模型无法持续进化等。

而现有的DP/ACT等具身小模型技能单一且无法快速学习新技能,GR-1/2等模型无法构建通用的场景感知、指令理解等能力,语义指令泛化受限,以及存在小样本泛化到新场景/新任务能力较弱等问题

智元新推出的ViLLA架构大模型可以比较好地解决这些问题。基于该架构的GO-1大模型可以结合互联网视频和真实人类示范进行学习,增强模型对人类行为的理解,更好地为人类服务。

由于具有强大的泛化能力,GO-1能够在极少数据甚至零样本下泛化到新场景、新任务,使得后训练成本非常低此外,GO-1大模型是通用机器人策略模型,能够在不同机器人形态之间迁移,快速适配到不同本体配智元一整套数据回流系统,GO-1可以从实际执行遇到的问题数据中持续进化学习,越用越聪明

在评测中,智元机器人在五种不同复杂度任务上针对GO-1的测试显示,相比已有的最优模型,GO-1的任务成功率领先,平均成功率提高了32%(46%->78%),其中在“Pour Water”(倒水)、“Table Bussing”(清理桌面)和“Restock Beverage”(补充饮料)的任务中表现尤为突出。

在成本方面,智元对界面新闻表示,目前机器人的研发成本中算力和数据是投入最大的两个方面,因此节约训练数据量对降低训练成本的效果显著。

对机器人公司来说,如果不做大模型,是没有未来的没有智能化没有作业能力的机器人只是一个硬件能做的事情非常有限所以我们对于机器人大模型的投入非常大的。”智元新创技术有限公司研究院执行院长、具身业务部总裁姚卯青对界面新闻强调,“就像新能源车和手机行业一样,硬件会收敛,供应链会整合,最后拼的是智能化。”

他透露,DeepSeek等大模型的工作给智元带来了很大的启发。智元参考了通用能力预训练加垂类数据后训练的思路,但在机器人领域增加了Latent Planner和Action Expert的创新。他还提到,最近火热的Agent智能体在任务规划上同样有借鉴意义,长期来看智元可能会在机器人上融合Agent理念。

在多模态大模型方面,智元表示,已经与阶跃星辰合作,后续将围绕阶跃的多模态、推理和训练、工程化等底层模型能力进行深度的合作,将阶跃星辰多模态等能力赋能到机器人上面。

姚卯青表示,大模型在机器人行业的应用也会经历一个渐进式的过程。从一些较为容易入手、结构化场景较为明确的场景先进性落地探索,然后逐渐演化到一些半结构化和半开放的任务和场景,最终通过在各个行业、各个场景落地过程中收集到的数据,真正实现通用人工智能在物理世界的应用。

从时间上来说,他预判,未来1-2年,人形机器人能够在局部工业场景应用落地,机器人走进家庭还需要5年左右的时间。此外,机器人实现像人一样有通用能力的物理世界AGI(通用人工智能)还需要5-10年时间。

在机器人技术方向上,他认为其还处于比较早期的阶段,没有到收敛的程度。受制于数据的问题,机器人行业还无法完成完整的验证,这也是智元希望去主动开源的原因。

去年12月30日,智元机器人宣布开源汇集百万真实机器人数据的开源数据集AgiBot World(智元世界)。在GO-1发布的同时,智元也将技术博客、论文完全公开一季度内,智元机器人还会面向核心用户开源GO-1模型

姚卯青还向界面新闻等媒体称,在本体、硬件、算法都还没有收敛的情况下,大家急着“卷”价格战没有什么意义。对于最近受关注的9.9万元机器人话题,他认为人形机器人产业还是要看产品竞争力,如果达不到给用户创造价值的时候打9.9万元,只会把整个行业变成一个很不健康的状态。

他透露,智元今年机器人出货量计划保持在数千台,营收数将保持数倍规模增长。今年1月,智元机器人刚刚宣布完成下线1000套通用具身机器人。

相关内容

热门资讯

中南文化:全资子公司收到《高新... 证券日报网讯 3月10日晚间,中南文化发布公告称,全资子公司江阴中南重工有限公司近期收到江苏省科学技...
泰国公布2024年旅游收入十大... 中新社曼谷3月10日电(李映民 冯浩航)泰国总理府副发言人萨西卡恩10日透露,泰国政府加快各方面、各...
安凯客车:截至2月28日,公司... 证券日报网讯安凯客车3月10日在互动平台回答投资者提问时表示,截至2月28日,公司的股东户数为53,...
广州“社区绣花”行动推动30个... 中新网广州3月10日电 (蔡敏婕 成广聚)破损的红砖路变成平整的水泥路;30余户居民告别搬瓶装煤气上...
注意!晋西车轴将于4月2日召开... 每经AI快讯,晋西车轴(SH 600495,收盘价:3.9元)3月10日发布公告称,2025年4月2...
游族网络:《我的三体:2277... 证券日报网讯游族网络3月10日在互动平台回答投资者提问时表示,《我的三体:2277》游戏上线时间请关...
“回南天”上线,这样“潮”的天... 雨+雾+“回南天”齐上线,本周广西的天气跌宕起伏。3月11日晚起,冷空气影响广西,桂北、桂东“回南”...
9.5万亿股份行,一副行长辞任 【导读】中信银行副行长吕天贵辞任中国基金报记者 晨曦“中信系”又有重要人事变动!3月10日晚间,中信...
雷电微力:公司未达满产状态 证券日报网讯雷电微力3月10日在互动平台回答投资者提问时表示,公司未达满产状态,近年来公司通过实施生...
绿地香港:1-2月合约销售金额... 来源:@经济观察报微博业绩快报 3月10日,绿地香港控股有限公司(00337.HK,以下简称“绿地香...
孙兴杰:如果乌克兰崩了,特朗普... 直新闻:据俄罗斯媒体报道,俄军已在库尔斯克州转入全线大规模进攻,乌军处境艰难,您有什么观察?特约评论...
嘉宏教育(01935):郑州经... 嘉宏教育(01935)发布公告,于2025年3月10日,经贸学院(郑州经贸学院)与承包商(河南先睿建...
美股异动|苹果跌4% 股价跌破... 苹果(AAPL.US)跌4%,股价跌破230美元关口。消息上,苹果官方已经确认,新版个性化Siri的...
我男朋友说我是废物!! 我男朋友说我是废物!!其实不必这么多想、如果你的男友真的认为你是废物的话、他还会和废物生活在一起吗?...
愿孩子一生顺遂的句子有哪些? 愿孩子一生顺遂的句子有哪些?1、宝贝!现在的你是一个美丽童话的开始,以后的故事也许包容百味,但一定美...
求本末世小说丶其他神作丶分类中... 求本末世小说丶其他神作丶分类中没有的类型 希望普通的丶不要一进来就是重生丶很牛丶杀怪升级丶不到几完美...
上进的名言 上进的名言10... 10 展开1、万般唤历缺卜皆下品,唯有读书高!——孔子2、书籍是人类思想的...
时代少年团真心话大冒险哪一期 时代少年团真心话大冒险哪一期是第六季的第三期,时代少年团来的
道理好讲,钱好难赚 道理好讲,钱好难赚慢慢来~~~先找个一般的工作,我觉得保安什么的都并不是什么不体面的工作,相反很锻炼...
蛋壳中间有个小猴子的,是叫什么... 蛋壳中间有个小猴子的,是叫什么名字啊,哪里可以买到小猴子呢请各位网友帮帮忙,非常谢谢!这是别人买了一...