您现在的位置:首页 / 新闻资讯 / 正文

工信部工业文化发展中心人工智能项目专家委员钟南海

发布时间:2024-03-09 19:49:50      阅读次数:333      新闻作者:     文章来源:专家委

2024年第一季度海外具身智能/人形机器人领域部分大事件汇总:


1、Google Gemini将支持机器人


Google发布的Gemini是一个多模态大模型,预计将扩展其支持范围,包括机器人技术。通过Gemini支持,机器人能够在处理具身智能任务,这对于许多领域尤其是医疗保健、家庭服务和公共安全领域的机器人应用至关重要。这也可能会增加公众对机器人技术的信任和接受度;


2、NVIDIA发布机器人专用GPU和开源具身智能开发套件


NVIDIA发布的一款专为机器人设计的GPU将具有更高的处理能力,特别优化了机器人视觉处理和深度学习任务的能力,这对于提升机器人的自主性和智能化水平至关重要。除此之外,NVIDIA宣布将发布一套开源的具身智能开发套件。这套工具的目标是降低机器人技术的门槛,使研究人员和开发者能够更容易地开发和测试具有高级认知和物理交互能力的机器人。这一举措可能会加速机器人技术的创新和应用,推动行业向前发展;


3、最新估值达20亿美元的具身智能人形机器人创业公司Figure展示了一种创新的方法,通过让机器人观看10小时的视频,使其学会例如制作咖啡这样的垂直场景。这一过程借鉴了MimicPlay技术,通过分析视频中的手臂运动轨迹来模拟动作。然而,这种方法的实用性有待验证;


4、具身智能创新算法不断问世


CMU的开门算法则展现了另一项技术突破。开门是一个复杂的任务,它不仅涉及多个步骤,还需要精确的力反馈。CMU的研究成果在于让机器人在真实环境中进行学习,从而迅速提升其操作能力;


在让机器人理解人类语言并执行任务方面,采用了类似于李飞飞教授的VIMA算法。这种算法的核心在于利用多模态大型模型,将人类的语言指令转换为机器人可以执行的动作序列,如抓取、拉开等,以完成特定任务。ALOHA则通过收集人类遥控机器人的操作数据,实现了对机器人动作的模仿学习;


Google RT2(Robotics Transformer)是用真实数据来训练大模型使其输出机器人运动的动作,而AutoRT是一个数据采集系统平台;


至于通用型抓取技术,AnyGrasp算法在这方面有显著成果。它能够在点云数据上识别出合适的抓取位置,然后指导机械臂进行精确抓取。然而,对于透明物体,点云数据可能会出现丢失,这时可以在应用AnyGrasp之前,采用一些点云补全算法来优化数据