机器人来抢保姆饭碗了,5年左右开卖,预计30万元+!已练习“冲咖啡”
创始人
2025-03-10 22:06:46
0

转自:九派新闻

清晨,叫醒你的不是闹钟 而是机器人“家人” 为你现冲的一杯香浓咖啡; 琐碎的洗衣服、叠衣服、挂衣服等家务, 机器人“家人”都为你轻松搞定 …… 

上海人形机器人再迎重要进展。3月10日,位于张江科学城的上海智元新创技术有限公司(以下简称“智元机器人”)正式官宣,发布全球首个基于百万真机数据训练的人形机器人具身基座大模型——Genie Operator-1(以下简称“GO-1”),致力于打造世界级通用人形机器人。 

作为一家致力于机器人技术创新的民营企业,智元机器人成立仅2年多,就凭借其前沿的技术创新,为机器人赋予了强大的场景感知、语言理解和动作执行能力。今天,智元机器人合伙人,具身业务部总裁姚卯青等接受记者采访时透露,家庭机器人等具身机器人有望在5年左右进入市场,预计定价在30万元以上。 

重新定义“具身智能”机器人 

今年全国两会上,“具身智能”首次被写入政府工作报告,迅速吸引各方关注。何为“具身智能”?通俗地说,就是让人工智能“拥有身体”。 

而智元机器人此次推出的大模型,不仅让机器人“拥有身体”,更将掀起具身机器人领域的颠覆性革命。“智元的GO-1模型,不仅具备强大的泛化能力,还能在极少的数据支持下快速适应新任务。这一突破性进展,使得机器人能够在家庭、办公、商业、工业等多种场景中灵活应用。无论是家庭中的餐食准备、桌面整理,还是工业环境中的复杂操作任务,GO-1都能轻松应对。”姚卯青介绍,“GO-1的推出,不仅仅是技术上的突破,更是我们对未来具身智能机器人生态的一次重新定义。我们期待通过这一模型,推动机器人从单一任务的工具,向具备通用智能的自主体发展”。 

谈到智元机器人大模型和传统技术的差异,智元具身研究中心常务主任广辉打了一个形象的比方,“以学习乒乓球为例,一般我们要通过图文、看别人打球或看比赛等方式,先了解基础或理论;再去训练场通过发球机或者和别人打球简单模拟;如果要有更高要求,还要找教练一对一手把手教学。”同理,机器人数据也呈“金字塔”结构,数量和成本越往上越稀缺、越贵,需要构建大规模通用场景,让机器人实现场景理解、指令理解、动作理解,完成精细动作、操作能力的学习。 

 超级工厂学习“超能力” 

具身机器人的超强学习能力从哪里来?在张江机器人谷,去年9月份,智元机器人在这里建设了全球首个数据采集超级工厂,之后发布了首个机器人的4D 世界模型。只见在近4000平方米的数采工厂,被分成不同主题的场景空间,还原了生活的不同功能布局,比如餐厅、客厅、卧室、衣帽间等,机器人可以各就各位、学习执行不同任务。 

每一个成功的机器人背后都有一个“真人”——数据采集员,看似一个简单的“倒水”动作,数据采集员们需要让“机器人”重复数百次、上千次甚至更多,只为采集到高质量的数据开展模型训练。在一台咖啡机前,只见机器人缓缓伸出机械手,一步步完成从拿杯子、放杯子、揿动咖啡机按钮、出咖啡结束后端咖啡杯等一系列动作,只是在最后一步将咖啡杯放到杯碟上略有倾斜,洒出了些许咖啡。 

“这种情况在数据采集过程中不时发生,测试人员发现类似问题后会及时上报,把这条数据回流。然后通过人工审核确保这些错误的数据加入后续大模型的训练中,让模型进化到更强的能力上。” 

据了解,GO-1的核心在于其创新的ViLLA(视觉-语言-隐动作规划-动作)框架。这个框架的独特之处在于,它不仅依赖于大规模的真机数据,还能够从互联网上的海量视频和图文数据中学习,增强了机器人的泛化能力和适应性。比如,家庭机器人不但能够操作洗衣机洗衣服,洗好后还能从事简单的叠衣服操作。当用户告诉机器人“挂衣服”时,GO-1能够根据视觉输入理解任务要求,并通过学习过的视频数据,自动规划并执行挂衣服的步骤。 

如果分解来看,机器人挂衣服需要分四步走: 

第一步:机器人通过“互联网的大规模纯文本和图文数据”学习,理解了“挂衣服”这句话在此情此景下的含义和要求; 

第二步:机器人学习过人类操作视频和其他机器人的各种操作视频,知道“挂衣服”这件事包含的所有步骤和环节; 

第三步:由于仿真数据中包含不同衣服、不同衣柜、不同房间等场景,机器人在“仿真世界”中模拟出“挂衣服”所有操作,因此能理解每一个操作环节中对应的物体和环境。 

第四步:通过预先学习的真人示教数据,机器人能精准完成“挂衣服”整个任务的操作。 

“ViLLA框架的成功应用,标志着机器人在复杂环境中的自主决策能力迈出了重要一步。将来甚至可能根据衣服的深浅等分开清洗,越来越智能化。”智元机器人技术团队负责人表示,“这意味着机器人不再局限于实验室,逐渐从封闭场景走向了开放的世界,越来越能清晰理解人类的指令。我们这个大模型发布后,可以加速整个具身智能机器人的普及,实现从特定任务向更加智能更加复杂的场景和任务上迈进。” 

何时飞入寻常百姓家 

2025年将是人形机器人的量产元年。在浦东,智元机器人等领军企业相继宣布完成量产或正进入量产准备,多家“造脑”“造身”头部企业、科研机构加大了在浦东的布局,人形机器人加速“进化”,浦东人形机器人量产趋势逐步显现。 

2023年2月,华为离职“天才少年”彭志辉等多位业内资深人士联合成立智元机器人公司。“上海浦东有顶尖的人工智能人才,融资渠道也很畅通。如今团队平均年龄30岁以下,用2年走完了其他企业8、9年的创新之路。2025年1月6日,智元通用具身机器人累计下线1000台。”姚卯青表示,“但家庭服务具身智能机器人从技术突破到普及,还有很长一段路要走,场景适配、产能提升是关键。” 

他透露,未来的机器人将不再是单一任务的工具,而是具备通用智能的自主体。它们将能够在工业、服务、医疗、物流、家庭等多个领域发挥重要作用,真正成为人类生活中的智能伙伴。有的单个场景应用只要千元或者万元级就可以达到很好的效果,比如早餐机器人万元内就可以实现。“但对精度、成功率、速度有更高要求的机器人,需要更多的数据,结合基座模型底座能力深入研发。”预计家庭机器人等将在5年左右完成研发并到投入市场,价格在30万元以上。 

“我们正积极探索与其他行业合作,推动机器人技术尽快实现商业化落地。期待随着具身机器人上下游产业链的不断完善,上海能成为中国乃至全球的具身机器人创新高地。” 

(上观·新民 上观·解放)

相关内容

热门资讯

英国沿海发生油轮与货轮相撞事故... 当地时间10日,美国军方发言人称,当日英国沿海发生碰撞事故的美国油轮正在短期租赁给美国海军军事海运司...
鹰眼预警:南侨食品营业收入与净... Hehson财经上市公司研究院|财报鹰眼预警3月11日,南侨食品发布2024年年度报告,审计意见为标...
民警许娜:织密反诈“防护网” ... 来源:法治日报 法治日报全媒体记者 张雪泓图为许娜在辖区开展反诈宣传。近日,北京市公安局丰台分局刑侦...
跌超9%!诺和诺德减肥药Cag... 声明:因水平有限,错误不可避免,或有些信息非最及时,欢迎留言指出。本文仅作医疗健康相关药物介绍,非治...
全国人大代表孟繁英:要进一步创... “稀土是我国重要的战略资源,也是不可再生资源。”3月6日,在十四届全国人大三次会议内蒙古自治区代表团...
女人说农村大妈怎么回答 女人说农村大妈怎么回答如果遇到女孩子说自己老阿姨,你可以这么回复她:1、你在我心里,永远18岁。你别...
娱乐圈中,你还知道哪些明星的励... 娱乐圈中,你还知道哪些明星的励志故事呢?胡歌。其实胡歌的星途是非常坎坷的,在自己最火的时候出车祸毁容...
求各种经典小说的配乐,比如斗破... 求各种经典小说的配乐,比如斗破的斗劫,三生三世的枕上书,傲风的风云叹等等,是玄幻风最好!歌曲 刹那芳...
1999年被贬下凡的神仙是真的... 1999年被贬下凡的神仙是真的吗 可信度不高可以当作是故事 1999年被贬下凡的神仙是真的吗,多半是...
抽象画中的越南少女故事是真的吗 抽象画中的越南少女故事是真的吗这个乃是传说,不可信。久远传说——被诅咒的抽象画19世纪末,正是越南被...
为什么说不有屈原,岂见《离骚》... 为什么说不有屈原,岂见《离骚》?因为如果没有屈原这个人物的话,就没有离骚这首词。就没有这种动人心魄的...
蜜蜂是蜜蜂从花粉里面弄出来的呀... 蜜蜂是蜜蜂从花粉里面弄出来的呀?蜂蜜是蜜蜂从花粉里面弄出来的呀?有些修车的人技术真是差,把车修得没明...
苏御唤醒东方神明的小说叫啥 苏御唤醒东方神明的小说叫啥苏御唤醒东方神明的小说叫《我一不小心把东方神全唤醒了》 。1、作者:苗苗种...
小学奥数火车相遇题,不太理解答... 小学奥数火车相遇题,不太理解答案,求详细解释,谢!!因为第二次相遇是双方各自到达对方起点后再返回,所...
雅创电子:目前代理分销的品牌如... 每经AI快讯,有投资者在投资者互动平台提问:请问贵公司及子公司在2024年度已启动人形机器人领域的部...
六角恐龙鱼怎么养? 六角恐龙鱼怎么养?水质清澈,不要放在高温的地方,少喂食,一个星期只要喂1到2次,喂一些水草等营养食物
成语猜猜看图大全答案 成语猜猜看图大全答案heir grieved parents'
请问阿西莫夫的《基地》系列阅读... 请问阿西莫夫的《基地》系列阅读顺序阅读顺序就是按照前传三部曲续集的顺序啊
刘震云 《手机 》中大家对谁印... 刘震云 《手机 》中大家对谁印象最深?说说吧讲四川话的 张国立
人的个性都有哪些 人的个性都有哪些没有精确的定义吧,我想应该是不同于常人的都叫个性吧~!