证券时报记者 陈雨康
以“具身智能 ,未来已来 ”为主题的2025张江具身智能开发者大会暨2025世界 人形机器人技能大赛5月29日在上海举行 。2025世界 人形机器人技能大赛设置5大赛道,覆盖28个高难度场景,本次大赛旨在集中展示人形机器人解决实际问题的能力和场景应用落地能力,助力机器人产业向“能看 、会说、有智商”进阶。
国家地方共建人形机器人创新中心首席科学家江磊在接受证券时报记者采访时表示 ,上海聚焦人形机器人在生产制造、服务场景中的实际应用,强调 “解决实际问题 ”。本次大赛设定商超、药店 、工业制造等真实场景任务,以场景驱动行业回归实用。江磊说 ,公众需以包容的心态看待机器人行业发展现状 。行业的快速发展仅有3年左右时间,如同“三岁儿童”,需给予它更长的时间发育。
记者了解到 ,此次赛事的所有项目均源自企业实际需求,每个赛道都还原了真实应用场景,总体难度较大。因此 ,机器人未能完成任务并非其个别技术水平欠佳,而是全行业尚有提升空间,这也体现了大赛的客观性和包容性 。
在人形机器人应用场景挑战赛进行时 ,记者看到,机器人正在裁判员的监督下完成汽车贴标、料箱搬运等高精度任务,另一侧家庭场景则考验机器人桌面总结 、衣物折叠等服务能力。这些任务,有利于验证当下机器人的负载 、地面适应、双臂协作等关键能力的实际水准。
上海交通大学学生张林同团队一起参加了工业场景赛 ,并聚焦汽车贴标和零部件上下料两项任务 。张林对证券时报记者表示,纵观整场赛事,机器人多依赖遥操作实现物料抓取等动作 ,尚未实现全自主操作,这表明其离真正的落地应用仍有一定距离。
“机器人的自主行为需通过训练实现,但当前数据集缺失 ,且算法创新不足,难以支撑机器人对复杂任务的自主决策。此外,一些机器人的硬件自由度不足 ,表明机械结构、控制精度等也有进步空间 。”张林表示,相比大语言模型的快速发展,具身智能(机器人物理交互)因涉及硬件 、算法、数据等多维度挑战 ,落地进度相对滞后。
近年来,机器人如何进入家庭、如何大规模入驻工业场景等正成为公众关注的焦点。对此,多名专家在接受证券时报记者采访时表示,机器人产业需要和大模型有机结合 ,形成软硬协同和多元场景落地,进而搭建起商业模式的正向闭环 。
千寻智能(杭州)科技有限公司CEO韩峰涛在接受证券时报记者采访时表示,近来 ,机器人硬件相对成熟,但机器人表现较“笨”,关键在于智能缺失 ,这也是行业的一大瓶颈。
“要解决这一问题,需打造端到端的具身大模型,让机器人能理解物理世界的规律和因果关系 ,从而自主调整动作。比如,让机器人理解足球并自主完成踢球动作,而不是当下的依赖遥控。 ”韩峰涛表示 ,中国凭借强大的供应链 、团队和丰富场景,在AI与硬件结合方面颇具优势 。不过,其中最大的难题是数据匮乏。训练大语言模型有互联网海量数据可用,但机器人干活的数据却需要重新采集 ,近来 主要通过海量视频预训练、遥操作微调以及强化学习来解决数据问题。
围绕上述难题,光轮智能(北京)科技有限公司创始人、CEO杨海波提出了一定的解决方案 。杨海波对证券时报记者表示,公司专注于为AI进入物理世界提供基于仿真技术的合成数据 ,能通过合成数据加速AI大脑训练及落地场景应用。
“仿真合成数据具有成本优势,无需依赖真实场景搭建与硬件设备,资源投入更低 ,数据生成效率更高。此外,仿真合成数据是泛化的 、多样的,可自定义各类极端或罕见场景 ,满足AI训练对数据多样性的需求 。”杨海波表示,当前行业通过真实数据、仿真合成数据、网络视频数据共同用于具身智能训练。公司积累了丰富的实践经验,形成了合成数据的使用方法论 ,包括配比和使用顺序等。事实上,具身智能训练阶段90%以上使用仿真合成数据 。