机器人来抢保姆饭碗了,5年左右开卖,预计30万元+!已练习“冲咖啡”
创始人
2025-03-10 22:06:46

转自:九派新闻

清晨,叫醒你的不是闹钟 而是机器人“家人” 为你现冲的一杯香浓咖啡; 琐碎的洗衣服、叠衣服、挂衣服等家务, 机器人“家人”都为你轻松搞定 …… 

上海人形机器人再迎重要进展。3月10日,位于张江科学城的上海智元新创技术有限公司(以下简称“智元机器人”)正式官宣,发布全球首个基于百万真机数据训练的人形机器人具身基座大模型——Genie Operator-1(以下简称“GO-1”),致力于打造世界级通用人形机器人。 

作为一家致力于机器人技术创新的民营企业,智元机器人成立仅2年多,就凭借其前沿的技术创新,为机器人赋予了强大的场景感知、语言理解和动作执行能力。今天,智元机器人合伙人,具身业务部总裁姚卯青等接受记者采访时透露,家庭机器人等具身机器人有望在5年左右进入市场,预计定价在30万元以上。 

重新定义“具身智能”机器人 

今年全国两会上,“具身智能”首次被写入政府工作报告,迅速吸引各方关注。何为“具身智能”?通俗地说,就是让人工智能“拥有身体”。 

而智元机器人此次推出的大模型,不仅让机器人“拥有身体”,更将掀起具身机器人领域的颠覆性革命。“智元的GO-1模型,不仅具备强大的泛化能力,还能在极少的数据支持下快速适应新任务。这一突破性进展,使得机器人能够在家庭、办公、商业、工业等多种场景中灵活应用。无论是家庭中的餐食准备、桌面整理,还是工业环境中的复杂操作任务,GO-1都能轻松应对。”姚卯青介绍,“GO-1的推出,不仅仅是技术上的突破,更是我们对未来具身智能机器人生态的一次重新定义。我们期待通过这一模型,推动机器人从单一任务的工具,向具备通用智能的自主体发展”。 

谈到智元机器人大模型和传统技术的差异,智元具身研究中心常务主任广辉打了一个形象的比方,“以学习乒乓球为例,一般我们要通过图文、看别人打球或看比赛等方式,先了解基础或理论;再去训练场通过发球机或者和别人打球简单模拟;如果要有更高要求,还要找教练一对一手把手教学。”同理,机器人数据也呈“金字塔”结构,数量和成本越往上越稀缺、越贵,需要构建大规模通用场景,让机器人实现场景理解、指令理解、动作理解,完成精细动作、操作能力的学习。 

 超级工厂学习“超能力” 

具身机器人的超强学习能力从哪里来?在张江机器人谷,去年9月份,智元机器人在这里建设了全球首个数据采集超级工厂,之后发布了首个机器人的4D 世界模型。只见在近4000平方米的数采工厂,被分成不同主题的场景空间,还原了生活的不同功能布局,比如餐厅、客厅、卧室、衣帽间等,机器人可以各就各位、学习执行不同任务。 

每一个成功的机器人背后都有一个“真人”——数据采集员,看似一个简单的“倒水”动作,数据采集员们需要让“机器人”重复数百次、上千次甚至更多,只为采集到高质量的数据开展模型训练。在一台咖啡机前,只见机器人缓缓伸出机械手,一步步完成从拿杯子、放杯子、揿动咖啡机按钮、出咖啡结束后端咖啡杯等一系列动作,只是在最后一步将咖啡杯放到杯碟上略有倾斜,洒出了些许咖啡。 

“这种情况在数据采集过程中不时发生,测试人员发现类似问题后会及时上报,把这条数据回流。然后通过人工审核确保这些错误的数据加入后续大模型的训练中,让模型进化到更强的能力上。” 

据了解,GO-1的核心在于其创新的ViLLA(视觉-语言-隐动作规划-动作)框架。这个框架的独特之处在于,它不仅依赖于大规模的真机数据,还能够从互联网上的海量视频和图文数据中学习,增强了机器人的泛化能力和适应性。比如,家庭机器人不但能够操作洗衣机洗衣服,洗好后还能从事简单的叠衣服操作。当用户告诉机器人“挂衣服”时,GO-1能够根据视觉输入理解任务要求,并通过学习过的视频数据,自动规划并执行挂衣服的步骤。 

如果分解来看,机器人挂衣服需要分四步走: 

第一步:机器人通过“互联网的大规模纯文本和图文数据”学习,理解了“挂衣服”这句话在此情此景下的含义和要求; 

第二步:机器人学习过人类操作视频和其他机器人的各种操作视频,知道“挂衣服”这件事包含的所有步骤和环节; 

第三步:由于仿真数据中包含不同衣服、不同衣柜、不同房间等场景,机器人在“仿真世界”中模拟出“挂衣服”所有操作,因此能理解每一个操作环节中对应的物体和环境。 

第四步:通过预先学习的真人示教数据,机器人能精准完成“挂衣服”整个任务的操作。 

“ViLLA框架的成功应用,标志着机器人在复杂环境中的自主决策能力迈出了重要一步。将来甚至可能根据衣服的深浅等分开清洗,越来越智能化。”智元机器人技术团队负责人表示,“这意味着机器人不再局限于实验室,逐渐从封闭场景走向了开放的世界,越来越能清晰理解人类的指令。我们这个大模型发布后,可以加速整个具身智能机器人的普及,实现从特定任务向更加智能更加复杂的场景和任务上迈进。” 

何时飞入寻常百姓家 

2025年将是人形机器人的量产元年。在浦东,智元机器人等领军企业相继宣布完成量产或正进入量产准备,多家“造脑”“造身”头部企业、科研机构加大了在浦东的布局,人形机器人加速“进化”,浦东人形机器人量产趋势逐步显现。 

2023年2月,华为离职“天才少年”彭志辉等多位业内资深人士联合成立智元机器人公司。“上海浦东有顶尖的人工智能人才,融资渠道也很畅通。如今团队平均年龄30岁以下,用2年走完了其他企业8、9年的创新之路。2025年1月6日,智元通用具身机器人累计下线1000台。”姚卯青表示,“但家庭服务具身智能机器人从技术突破到普及,还有很长一段路要走,场景适配、产能提升是关键。” 

他透露,未来的机器人将不再是单一任务的工具,而是具备通用智能的自主体。它们将能够在工业、服务、医疗、物流、家庭等多个领域发挥重要作用,真正成为人类生活中的智能伙伴。有的单个场景应用只要千元或者万元级就可以达到很好的效果,比如早餐机器人万元内就可以实现。“但对精度、成功率、速度有更高要求的机器人,需要更多的数据,结合基座模型底座能力深入研发。”预计家庭机器人等将在5年左右完成研发并到投入市场,价格在30万元以上。 

“我们正积极探索与其他行业合作,推动机器人技术尽快实现商业化落地。期待随着具身机器人上下游产业链的不断完善,上海能成为中国乃至全球的具身机器人创新高地。” 

(上观·新民 上观·解放)

相关内容

热门资讯

中衡设计(603017.SH)... 格隆汇4月22日丨中衡设计(603017.SH)发布2025年年报显示,公司全年实现营业收入11.7...
海港人寿总经理变更:齐美祝任临...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   每经记者|涂颖浩...
出息了!德国市长试乘贵州造无人...   2026年4月21日,德国东部城市开姆尼茨。市政厅门前,一辆圆润的胶囊状小巴缓缓驶出。车内坐着三...
谷歌推出AI训练与推理专用芯片...   核心要点谷歌将推出一款专门运行人工智能模型的芯片,同时推出另一款独立处理器用于模型训练。亚马逊也...
龙腾光电修订公司章程及多项治理... 4月23日,龙腾光电(证券代码:688055)发布公告称,公司于2026年4月22日召开第三届董事会...