本报记者 蒋牧云 李晖 上海、北京报道
随着春晚上扭秧歌的人形机器人火“出圈”,也将具身智能的概念代入大众视野。作为人工智能领域的前沿热点,具身智能在2025年全国两会上格外受到关注。
2025年政府工作报告就提出,要建立未来产业投入增长机制,培育生物制造、量子科技、具身智能、6G等未来产业。这也是“具身智能”首次在报告中被提出。
《中国经营报》记者了解到,十四届全国政协委员,天娱数科(002354.SZ)CEO,山西数据流量谷董事长贺晗今年两会的提案方向就重点关注了具身智能和人形机器人的相关问题。
他向记者表示,目前行业内存在的共性问题是缺乏通用平台,包括算法通用开发平台、通用3D数据平台、通用标准认证平台、通用场景测试平和通用人才培养平台。针对此,贺晗建议建立国家级具身智能发展规划、鼓励通用平台建设、加快相关标准建设。
避免重复“造轮子”
具身智能,指一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。
贺晗向记者表示:“过去我们谈人形机器人技术时,主要关注点在硬件,当前则更多是强调大脑和小脑方面的技术跨越——具身智能大模型技术开始与人形机器人本体融合、进化,使人形机器人成为具生智能的关键载体。这是革命性的,是一场从‘机械躯壳’到‘数字生命’的进化革命,让门槛大幅降低、场景快速增多。”
在贺晗看来,当前具身智能的发展存在一些障碍:首先是缺乏算法通用开发平台,多数企业都要从0到1独立研发,导致重复投入和资源分散,影响成本更影响效率。其次是缺乏通用3D数据平台,高质量3D数据集稀缺,3D数据采集设备未普及,3D数据获取成本高、标准化程度低,制约具身智能深度训练。最后是缺乏通用标准认证平台,硬件接口、通信协议、数据格式等缺乏统一规范,不同厂商的机器人本体构型与软件架构互不兼容,具身智能难以跨本体,制约规模化应用。
除此之外,通用场景测试平台和行业标准场景库的缺失亦亟需补齐。在贺晗看来,当前该领域缺乏类似“自动驾驶开放测试区”的公共服务平台,导致应用场景单一,商业导览、教育科研为主。行业还缺乏通用人才培养平台,懂机械、自动化的多,懂大模型的少,两者都懂的通才少之又少。
因此,贺晗建议,建立国家级具身智能发展规划,并鼓励通用平台建设,避免重复“造轮子”。鼓励开发从硬件到软件、从底层到应用层、从AI模型底座到3D数据集的通用开发套件,如开源代码库、仿真环境库、开源数据集等,降低创业、研发门槛。
同时,加快标准建设,创建生态认证体系。鼓励建立“具身智能兼容性认证”,对通过协议兼容性测试的产品给予一定补贴,降低异构系统整合成本。
贺晗还建议,鼓励建立跨行业测试平台,依托高校或大厂建设具身智能机器人测试中心,搭建多场景、多任务开放物理测试环境,提供多模态感知、动态决策等核心能力的标准化测试服务,降低企业技术验证成本。加强复合型人才培养。建议在高校中设置具身智能、人工智能+机器人相关专业或方向,培养通才,破解“机械臂不懂神经网络”的认知割裂。
迈向智能时代
在贺晗看来,人形机器人的技术发展可总结为三个阶段:1.0机械纪元,基于程序控制的演示阶段。通过预先编写的程序或强化学习算法进行控制。这些程序通常是由工程师根据特定的任务和场景进行编写,机器人按照指令完成简单的动作演示。
2.0模仿纪元,基于大模型的模仿阶段。在大模型技术的快速迭代升级下,机器人模仿学习技术有了巨大突破并开始流行。视觉-语言-动作(VLA)模型的发展让人形机器人能够更高效地完成从视觉、语言理解到推理并生成动作的全过程,将自然语言指令转化为具体行动规划,并具备一定泛化能力。
3.0觉醒纪元,基于海量3D数据的智能阶段。贺晗认为,这将是行业下一步的发展方向,从被动响应和执行到主动感知和决策。
“最为核心的是海量3D数据的喂养,通过世界模型+具身智能,创建对世界运作方式的内部表征,并具备行动后果的推理能力。不仅可以适应复杂多变的环境和任务需求,更为重要的是,具备自主决策、行动与操作能力。”他谈道。
贺晗认为,通用平台的发展方向是具身智能大模型一体机,通过“算法+数据+算力”三位一体,实现跨本体互通互用,让每家机器人本体企业即插即用。
(编辑:李晖 审核:何莎莎 校对:颜京宁)
下一篇:王毅五问美国