您现在的位置:首页 / 新闻资讯 / 正文

专家观点 | 工信部文化中心人工智能项目专家委员钟南海:人形机器人在具身智能领域所积累的数据如何显现出优势

发布时间:2024-03-22 09:02:47      阅读次数:280      新闻作者:     文章来源:专家委

1、和自动驾驶相比,具身智能的架构系统更为复杂:

1.1. 比如中国头部的人形机器人供应商和海外头部企业Figure在具身智能架构方面类似:大模型+技能外挂+运控;

1.2. 长远目标是把技能外挂逐步融合到大模型中,以充分利用大模型能力来提升技能能力。但有的技能外挂是长期保留的,比如触觉相关的技能,难以融入大模型

2、和自动驾驶相比,具身智能的数据有如下几个不同:

2.1. Aloha和Google RT1是纯的端到端方法,主要假设数据源只有一种规格和来源,需要比自动驾驶更多的数据才能实现落地,但汽车可有人操作、机器人没有,所以这个方式难以实现可控成本的数据积累;

2.2. 大模型+技能外挂+运控,这个范式更加实际,可以对不同技能选择合适的数据来源和学习方法;

2.3. 不同的技能所需要的数据源和scaling law是不一样的。例如:只基于感知技能10亿量级数据可以有很好的效果(如:视觉抓取),特定类别的物品1万量级物体可以有很好效果(如:开门把手);

2.4. 物理相关技能(如:端子插接)难以通过仿真解决,需要收集真实数据,例如特定的端子插接需要10mins.-10hrs的真实数据;


因此,具身智能的数据有异构数据源、异构方法的特点


3、具身智能的数据建设需要先实现数据闭环、才能实现数据增量

3.1. 自动驾驶因为有人类驾驶员可以轻易实现数据闭环,具身智能需要让机器人先干活;

3.2. 打通具身数据闭环有两大优势:1)仿真数据,可快速地实现新场景的视觉相关技能的泛化;2)真实世界的快速学习,可实现快速实现新场景的物理相关技能的泛化(e.g. 机器人在真实世界快速学习端子插接,并实现100%成功率)。只有当机器人能自动快速地适应新场景、自主完成任务,才能打通数据闭环;

3.3. 打通数据闭环后,具身算法组可以变成具身数据组,结合股东的场景优势来快速构建数据优势