擀面皮包饺子,MIT、CMU等的研究员让机器人自己学会了
发布时间:2022-04-02 13:46:16 文章来源:扬子晚报
你能想象让机器人揉面团,擀面皮,包饺子吗?对机器人来说,操纵衣物、面团等柔软无坚固形状的可形变材料一直是个棘手的问题。面团的形状可以

你能想象让机器人揉面团,擀面皮,包饺子吗?对机器人来说,操纵衣物、面团等柔软无坚固形状的可形变材料一直是个棘手的问题。面团的形状可以以多种方式变化,而这些变化很难用方程式表示。

此外,从面团中创建新形状需要多个步骤并使用不同的工具。对于机器人来说,学习具有长步骤序列的操作任务尤其困难,因为学习通常是通过反复试验完成的,其中有许多可能的选择。

当地时间3月30日,麻省理工学院、卡内基梅隆大学和加州大学圣地亚哥分校的研究人员为这种任务提出了一种更好的方法。他们创造了一种“两阶段学习框架”,名为“Teacher”(老师)的算法解决机器人要完成任务所必需的每个步骤,然后它训练“Student”(学生)机器学习模型去学习关于何时及如何执行任务所需的每项技能的抽象概念,比如用擀面杖。有了这些知识,系统就会推理出如何执行技能来完成整个任务。

研究人员认为,这种他们称之为DiffSkill的方法可以在模拟中执行复杂的操作任务,例如切和揉面团,或从砧板周围收集面团,同时优于其他机器学习方法。

除了制作披萨、饺子外,这种方法还可以应用于机器人需要操纵可形变物体的其他环境中,如为老年人或运动障碍者喂食、洗澡或穿衣的护理机器人。

“这种方法更接近我们人类计划行动的方式。当一个人执行一项长期任务时,我们并没有写下所有的细节。我们有一个更高级别的计划者,它大致告诉我们在此过程中需要实现哪些阶段以及一些中间目标,然后我们执行它们,”论文作者之一,MIT计算机科学与人工智能专业的研究生李云珠说道。

分开来看具体的工作原理。DiffSkill框架中的“Teacher”是一种轨迹优化算法,可以解决物体初始状态和目标位置很接近的短视界(short-horizon)任务。轨迹优化器在模拟现实世界的物理模拟器中工作(称为可微物理模拟器,它将“Diff”放入“DiffSkill”中)。“Teacher”算法使用模拟器中的信息来学习面团在每个阶段必然如何移动,一次一个,然后输出这些轨迹。

然后“Student”神经网络学会模仿老师的动作。作为输入,它使用两个摄像头图像,一个显示当前状态的面团,另一个显示任务结束时的面团。神经网络生成一个高级计划,以确定如何将不同的技能联系起来以达到目标。然后,它为每个技能生成特定的、短视界的轨迹,并将命令直接发送到工具。

研究人员使用这种技术对三种不同的模拟面团操作任务进行了实验。在一项任务中,机器人使用抹刀将面团举到砧板上,然后使用擀面杖将其压平。在另一个例子中,机器人使用抓手从柜台上收集面团,将其放在抹刀上,然后将其转移到砧板上。在第三个任务中,机器人用刀将一堆面团切成两半,然后使用夹具将每一块面团运送到不同的位置。

“DiffSkill能够胜过依赖强化学习的流行技术,在强化学习中,机器人通过反复试验来学习任务。事实上,DiffSkill是唯一能够成功完成所有三个面团操作任务的方法。有趣的是,我们发现‘Student’神经网络甚至能够胜过‘Teacher’算法,”卡内基梅隆大学 (CMU) 研究生林兴宇说道。

林兴宇认为,这个框架为机器人获得新技能提供了一种新颖的方式,可以将这些技能链接起来,以解决更复杂的任务。这些任务超出了以前的机器人系统的能力。

因为他们的方法侧重于控制工具(抹刀、刀、擀面杖等),所以它可以应用于不同的机器人,但前提是它们要使用研究人员定义的特定工具。未来,他们计划将工具的形状整合到“Student”网络的推理中,以便将其应用于其他设备。

研究人员打算通过使用3D数据作为输入来提高DiffSkill的性能,而不是使用难以从模拟传输到现实世界的2D图像。他们还希望使神经网络规划过程更高效,并收集更多样的训练数据,以增强DiffSkill对新情况的泛化能力。从长远来看,他们希望将 DiffSkill应用到更多样化的任务中,包括布料操作。

这项研究由卡内基梅隆大学(CMU)研究生林兴宇,加州大学圣地亚哥分校研究生黄志奥,麻省理工学院脑与认知科学系认知科学与计算职业发展教授Joshua B. Tenenbaum,CMU助理教授David Held,以及MIT-IBM Watson AI Lab的研究科学家 Chuang Gan合作完成。其得到了美国国家科学基金会、LG电子、麻省理工学院-IBM 沃森人工智能实验室、美国海军研究办公室和国防高级研究计划局的部分支持。

标签: 理工学院 圣地亚哥

热点HOT

  • 笔记本电脑哪个牌子好  笔记本电脑怎么选
    笔记本电脑哪个牌子好 笔记本

    笔记本质量十大排名十大笔记本电脑品牌?笔记本电脑哪个牌子好?国内十大笔记本电脑排名:1、苹果apple(成立于1976年,是一家高端电脑、音视

  • 音乐学院招生选拔特点 11大音乐学院招生选拔特点
    音乐学院招生选拔特点 11大音乐

    对所有音乐艺考生来说,全国11大音乐学院(中央音乐学院、中国音乐学院、上海音乐学院、天津音乐学院、浙江音乐学院、西安音乐学院、武汉音

  • 为什么用文本来生成视频的 AI 工具也正变得越来越多
    为什么用文本来生成视频的 AI

    如同最近一年 DALL-E 2、Stable Diffusion 等文本生成图像模型发展一样,用文本来生成视频的 AI 工具也正变得越来越多。继 Meta 的

  • 保持血液中药物的最佳浓度 仍然是现代医学的主要挑战
    保持血液中药物的最佳浓度 仍然

    成功治疗疾病的关键方法之一,是在整个治疗过程中提供并维持体内药物的适当剂量。过少会降低治疗效率、导致耐药性,而过量则会增加副作用。

  • 卡内基梅隆大学成功开发出一款多功能、可更换、持久耐用的触感皮肤
    卡内基梅隆大学成功开发出一款多

    如今,人工智能逐渐与声音、视觉等人类感官融合,使人们之间的交流更便捷。但是,将人工智能与人类的触觉融合仍具有挑战性。为解决此项难题

  • Rubius采取了一系列节约成本的措施 包括裁员 75%
    Rubius采取了一系列节约成本的措

    今年 9 月 14 日,(NASDAQ: RUBY,以下简称为Rubius)宣布进行重组和调整资源,称接下来将重点集中在下一代红细胞偶联平台上。官方通稿

  • 为什么马斯克要重启短视频应用Vine
    为什么马斯克要重启短视频应用Vi

    短视频平台 (有可能)即将回归。从 2012 年到 2017 年,这款备受喜爱的有趣短视频分享软件在聚光灯下昙花一现,在鼎盛时期被关闭了服务

  • 基于阳离子脂质的高效纳米疫苗递送系统 细胞因子产量增加约100倍!
    基于阳离子脂质的高效纳米疫苗递

    近年来,免疫检查点抑制疗法等作为治疗癌症的新方法备受关注。然而,当前的免疫检查点抑制疗法仅对约 20%~30% 的癌症患者有效。部分原因

  • 打造一棵人类百年“科技树” 腾讯新总部将建永久科技馆
    打造一棵人类百年“科技树” 腾

    11月6日,2022腾讯科学WE大会十周年如期举行。"十年前,马化腾在首届WE大会上种下一颗种子,希望助力基础科学普及。WE大会历经十年,展现了

  • iOS 16又出新Bug:Face ID无法正常工作
    iOS 16又出新Bug:Face ID无法

    在数个版本的更迭之后,iOS 16的稳定性已经有了相当明显的提升,但仍有部分用户遇到了新的Bug。近日,有部分iPhone用户反馈称,自己的手机

新闻LOVE