转自:九派新闻
清晨,叫醒你的不是闹钟 而是机器人“家人” 为你现冲的一杯香浓咖啡; 琐碎的洗衣服、叠衣服、挂衣服等家务, 机器人“家人”都为你轻松搞定 ……
上海人形机器人再迎重要进展。3月10日,位于张江科学城的上海智元新创技术有限公司(以下简称“智元机器人”)正式官宣,发布全球首个基于百万真机数据训练的人形机器人具身基座大模型——Genie Operator-1(以下简称“GO-1”),致力于打造世界级通用人形机器人。
作为一家致力于机器人技术创新的民营企业,智元机器人成立仅2年多,就凭借其前沿的技术创新,为机器人赋予了强大的场景感知、语言理解和动作执行能力。今天,智元机器人合伙人,具身业务部总裁姚卯青等接受记者采访时透露,家庭机器人等具身机器人有望在5年左右进入市场,预计定价在30万元以上。
重新定义“具身智能”机器人
今年全国两会上,“具身智能”首次被写入政府工作报告,迅速吸引各方关注。何为“具身智能”?通俗地说,就是让人工智能“拥有身体”。
而智元机器人此次推出的大模型,不仅让机器人“拥有身体”,更将掀起具身机器人领域的颠覆性革命。“智元的GO-1模型,不仅具备强大的泛化能力,还能在极少的数据支持下快速适应新任务。这一突破性进展,使得机器人能够在家庭、办公、商业、工业等多种场景中灵活应用。无论是家庭中的餐食准备、桌面整理,还是工业环境中的复杂操作任务,GO-1都能轻松应对。”姚卯青介绍,“GO-1的推出,不仅仅是技术上的突破,更是我们对未来具身智能机器人生态的一次重新定义。我们期待通过这一模型,推动机器人从单一任务的工具,向具备通用智能的自主体发展”。
谈到智元机器人大模型和传统技术的差异,智元具身研究中心常务主任广辉打了一个形象的比方,“以学习乒乓球为例,一般我们要通过图文、看别人打球或看比赛等方式,先了解基础或理论;再去训练场通过发球机或者和别人打球简单模拟;如果要有更高要求,还要找教练一对一手把手教学。”同理,机器人数据也呈“金字塔”结构,数量和成本越往上越稀缺、越贵,需要构建大规模通用场景,让机器人实现场景理解、指令理解、动作理解,完成精细动作、操作能力的学习。
超级工厂学习“超能力”
具身机器人的超强学习能力从哪里来?在张江机器人谷,去年9月份,智元机器人在这里建设了全球首个数据采集超级工厂,之后发布了首个机器人的4D 世界模型。只见在近4000平方米的数采工厂,被分成不同主题的场景空间,还原了生活的不同功能布局,比如餐厅、客厅、卧室、衣帽间等,机器人可以各就各位、学习执行不同任务。
每一个成功的机器人背后都有一个“真人”——数据采集员,看似一个简单的“倒水”动作,数据采集员们需要让“机器人”重复数百次、上千次甚至更多,只为采集到高质量的数据开展模型训练。在一台咖啡机前,只见机器人缓缓伸出机械手,一步步完成从拿杯子、放杯子、揿动咖啡机按钮、出咖啡结束后端咖啡杯等一系列动作,只是在最后一步将咖啡杯放到杯碟上略有倾斜,洒出了些许咖啡。
“这种情况在数据采集过程中不时发生,测试人员发现类似问题后会及时上报,把这条数据回流。然后通过人工审核确保这些错误的数据加入后续大模型的训练中,让模型进化到更强的能力上。”
据了解,GO-1的核心在于其创新的ViLLA(视觉-语言-隐动作规划-动作)框架。这个框架的独特之处在于,它不仅依赖于大规模的真机数据,还能够从互联网上的海量视频和图文数据中学习,增强了机器人的泛化能力和适应性。比如,家庭机器人不但能够操作洗衣机洗衣服,洗好后还能从事简单的叠衣服操作。当用户告诉机器人“挂衣服”时,GO-1能够根据视觉输入理解任务要求,并通过学习过的视频数据,自动规划并执行挂衣服的步骤。
如果分解来看,机器人挂衣服需要分四步走:
第一步:机器人通过“互联网的大规模纯文本和图文数据”学习,理解了“挂衣服”这句话在此情此景下的含义和要求;
第二步:机器人学习过人类操作视频和其他机器人的各种操作视频,知道“挂衣服”这件事包含的所有步骤和环节;
第三步:由于仿真数据中包含不同衣服、不同衣柜、不同房间等场景,机器人在“仿真世界”中模拟出“挂衣服”所有操作,因此能理解每一个操作环节中对应的物体和环境。
第四步:通过预先学习的真人示教数据,机器人能精准完成“挂衣服”整个任务的操作。
“ViLLA框架的成功应用,标志着机器人在复杂环境中的自主决策能力迈出了重要一步。将来甚至可能根据衣服的深浅等分开清洗,越来越智能化。”智元机器人技术团队负责人表示,“这意味着机器人不再局限于实验室,逐渐从封闭场景走向了开放的世界,越来越能清晰理解人类的指令。我们这个大模型发布后,可以加速整个具身智能机器人的普及,实现从特定任务向更加智能更加复杂的场景和任务上迈进。”
何时飞入寻常百姓家
2025年将是人形机器人的量产元年。在浦东,智元机器人等领军企业相继宣布完成量产或正进入量产准备,多家“造脑”“造身”头部企业、科研机构加大了在浦东的布局,人形机器人加速“进化”,浦东人形机器人量产趋势逐步显现。
2023年2月,华为离职“天才少年”彭志辉等多位业内资深人士联合成立智元机器人公司。“上海浦东有顶尖的人工智能人才,融资渠道也很畅通。如今团队平均年龄30岁以下,用2年走完了其他企业8、9年的创新之路。2025年1月6日,智元通用具身机器人累计下线1000台。”姚卯青表示,“但家庭服务具身智能机器人从技术突破到普及,还有很长一段路要走,场景适配、产能提升是关键。”
他透露,未来的机器人将不再是单一任务的工具,而是具备通用智能的自主体。它们将能够在工业、服务、医疗、物流、家庭等多个领域发挥重要作用,真正成为人类生活中的智能伙伴。有的单个场景应用只要千元或者万元级就可以达到很好的效果,比如早餐机器人万元内就可以实现。“但对精度、成功率、速度有更高要求的机器人,需要更多的数据,结合基座模型底座能力深入研发。”预计家庭机器人等将在5年左右完成研发并到投入市场,价格在30万元以上。
“我们正积极探索与其他行业合作,推动机器人技术尽快实现商业化落地。期待随着具身机器人上下游产业链的不断完善,上海能成为中国乃至全球的具身机器人创新高地。”
(上观·新民 上观·解放)
下一篇:文科 学医