当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 机器人落地「秘诀」:持续学习、知识迁移和自主参与

机器人落地「秘诀」:持续学习、知识迁移和自主参与

来源:51CTO.COM 2023-04-30 16:06:49 0浏览 收藏

今日不肯埋头,明日何以抬头!每日一句努力自己的话哈哈~哈喽,今天我将给大家带来一篇《机器人落地「秘诀」:持续学习、知识迁移和自主参与》,主要内容是讲解等等,感兴趣的朋友可以收藏或者有更好的建议在评论提出,我都会认真看的!大家一起进步,一起学习!

机器人落地「秘诀」:持续学习、知识迁移和自主参与

本文转自雷锋网,如需转载请至雷锋网官网申请授权。

​2022年5月23日,一年一度的机器人技术领域的顶级国际会议 ICRA 2022 (IEEE International Conference on Robotics and Automation) 在美国费城如期举行。

这是ICRA举办的第39个年头。ICRA 是 IEEE 机器人和自动化学会的旗舰会议,也是机器人研究者展示和讨论他们工作的主要国际论坛。

在今年的ICRA上,亚马逊的三位首席机器人专家,Sidd Srinivasa、 Tye Brady 和 Philipp Michel 简单讨论了在现实世界中构建人机互动的机器人系统所面临的挑战。

机器人落地「秘诀」:持续学习、知识迁移和自主参与

图注:从左到右为亚马逊机器人人工智能主管 Sidd Srinivasa,亚马逊机器人公司(全球)首席技术专家 Tye Brady,以及亚马逊 Scout 应用科学高级经理 Philipp MichelSidd

Srinivasa是全球知名的机器人专家,IEEE Fellow,现任华盛顿大学波音特聘教授,同时是 Amazon 机器人人工智能项目的负责人,负责管理协助 Amazon 物流中心员工的自主机器人的算法,研究可以收拾和包装产品的机器人和可自主搬卸和运输货物的推车式机器人。

Tye Brady是亚马逊机器人公司(全球)首席技术专家,MIT航空航天工程硕士背景。而Philipp Michel与Sidd Srinivasa同为CMU机器人研究所的博士校友,是亚马逊Scout机器人项目的高级经理。

在探讨解决机器人落地挑战的问题上,他们提出了自己的看法。AI科技评论作了不改原意的整理,如下:

Q: 你们在机器人领域的研究分别解决不同的问题,这些问题之间有什么相同点?

Sidd Srinivasa:机器人研究的一个重要难点是:我们生活在一个开放的世界中。我们甚至不知道即将面对的「输入」是什么。在我们的营运中心,我需要操控超过2000万件物品,而且这些物品还以每天成千上百件的数量在增加。大部分时候,我们的机器人并不清楚它们所拾起的物品是什么,但它们需要小心地拾起物品,并在不损坏物品的前提下将物品进行快速包装。

Philipp Michel:对于Scout来说,难点是在人行道上遇到的物体,以及运送的环境。我们在美国四个州都部署了私人送货设备。天气状况、光照条件……我们从一开始就明确要处理大量的变量,使机器人能够适应复杂的环境。

Tye Brady:在开发执行机器人的过程中,我们有一个显著的优势,就是在半结构化的环境中展开运营。我们可以自行制定机器人的交通规则,了解环境真的有助于我们的科学家和工程师深入理解我们要移动、操作、分类和识别的物体,完成订单。也就是说,我们可以在真实世界中实现对技术的追求。

Philipp Michel :还有另一个共同点,就是我们非常依赖从数据中学习,以解决问题。Scout 会在执行任务的过程中接收真实世界的数据,然后不断迭代开发用于感知、定位和导航的机器学习解决方案。

Sidd Srinivasa:我完全同意(从数据中学习解决问题)。我认为机器学习和自适应控制是超线性规模拓展的关键。如果我们部署了成千上万的机器人,我们不可能有成千上万的科学家和工程师来研究它们,我们需要依赖真实世界的数据,实现超线性地增长。

另外,我认为开放的世界会迫使我们思考怎样「持续学习」。我们的机器学习模型往往是基于一些输入数据分布来训练的,但因为这是一个开放的世界,会遇到「协变量转移」(covariate shift)的问题,也就是看到的数据与分布不匹配,这会导致机器学习模型常常没来由地过于自信。

因此,我们所做的大量工作就是创建一个「watchdogs」(看门狗,一种监督设备),用来识别输入数据分布何时偏离了它所受训的分布。然后,我们再进行「重要性抽样」(importance sampling),这样我们就可以挑选出已经改变的数据,重新训练机器学习模型。

Philipp Michel:这也是为什么我们想要在不同的地方训练机器人的原因之一,这样我们就可以尽早知道机器人可能遇到的现实数据,反过来迫使我们开发能够解决新数据的方案。

Sidd Srinivasa:这的确是个好主意。拥有多机器人的优点之一就是系统能够识别出变化的内容,重新进行训练,然后将这些知识分享给其他机器人。

想到一个分拣机器人的故事:在世界的某个角落,一个机器人遇到一个新的包装类型。一开始,它很困扰,因为它从来没有见过这种情况,也无法识别出来。后来出现了一个新的解决方案:这只机器人可以将新的包装类型传输给世界上所有机器人。如此一来,当这种新包装类型出现在其他地方,其余机器人就知晓如何处理了。相当于有了一个「备份」,新的数据出现在一个点,其他点都会知道,因为系统已经能够重新自我训练、并分享信息了。

Philipp Michel:我们的机器人也在做类似的事情。如果我们的机器人遇到之前没有遇到过的新障碍,我们会尝试调整模型来识别与处理这些障碍,随后将新的模型部署到所有的机器人上。

让我夜不能寐的一件事情是,我们的机器人会在人行道上遇到新的物体,但这些物体在接下来的三年都不会再遇到,例如:人们在万圣节上用来装饰草坪的滴水兽,或者人们在野餐的桌子上放一把伞、使桌子看起来不像「野餐桌」。对于这种情况,所有的机器学习算法都无法识别出这是一张野餐桌。

因此,我们的部分研究还是关于如何平衡无需纠结的普通事物与具体类别的事物。如果这是一个敞开的井盖口,那么机器人一定要善于识别,不然它会掉下去。但如果它只是一个随机的盒子,我们可能就不需要知道这个盒子的层次结构,只需要知道这是我们要绕过去的物体即可。

Sidd Srinivasa:另一个挑战是,当你改变你的模型时,可能会出现意想不到的后果。改变后的模型也许不会影响机器人的感知,但可能会改变机器人「刹车」方式,导致两个月后滚珠轴承磨损。在端到端的系统中,未来许多有趣的研究都是关于“理解系统部分更改对整个系统性能的影响”。

Philipp Michel:我们花了很多时间思考是否应该划分机器人堆栈的不同部分。在他们之间做整合能够带来很多好处,但也是有限的。一个极端情况是摄像头到电机到扭矩的学习,这在任何现实世界的机器人应用中都是非常具有挑战性的。还有就是传统的机器人堆栈,它被很好地分成了定位、感知、规划和控制等部分。

我们还花了很多时间思考堆栈应该如何随着时间的推移而发展,把这些部分更紧密地结合在一起时性能有什么提升?同时,我们希望有一个系统尽可能地保持可解释性。我们试图最大化利用整个堆栈的学习组件集成,同时保留可解释性和安全功能的数量。

Sidd Srinivasa:这个观点很赞,我完全同意 Philipp 的观点,用一个模型来统治所有模型未必是正确的。但通常,我们最终建立的机器学习模型共享一个主干,有多个应用的头。一个物体是什么,分割一个物体意味着什么?可能类似于挑选、堆放或者包装,但是每一个都需要专门的头,搭载在专门任务的主干上。

Philipp Michel:我们考虑的一些因素是电池、行程、温度、空间和计算限制。因此,我们需要高效使用我们的模型、优化模型、并尝试尽可能多地利用共享主干,就像 Sidd 提到的,不同的头用于不同的任务。

机器人落地「秘诀」:持续学习、知识迁移和自主参与

图注:Amazon Scout 是一个自动送货机器人,它可以在公共人行道上以步行的速度移动,目前正在美国四个州进行实地测试。

Q:当我问及你们项目之间的共性时,我想到的一件事是你们的机器人都是和人类在同样的环境中工作。为什么这会使问题复杂化呢?

Sidd Srinivasa:机器人正在走近人类生活,我们必须尊重发生在人类世界中的所有复杂的互动。除了走路、开车、执行任务外,还有复杂的社交。对机器人来说重要的是,首先,要有意识;其次,要参与其中。

这真的很难,当你在开车的时候,有时很难判断其他人在想什么,也很难根据他们的想法来决定如何行动。仅仅是推理问题就很难,然后闭环就更难了。

如果机器人正在下棋或与人对弈,那么预测他们将要做什么就容易多了,因为规则已经很好地制定了。如果你假设你的对手是最优的,那么你会做得很好,即使他们是次优的。这在某些双人游戏中是种保证。

但实际情况并非如此,我们在玩这种确保双赢的合作博弈发现,博弈时其实很难准确预测,即便合作者也是好意。

Philipp Michel:而且人类世界的行为变化很大。有的宠物完全无视机器人,有的宠物会走向机器人。行人也是如此,有些人对机器人视而不见,而有些人则径直走近它。特别是孩子,他们的好奇心超强,互动非常密切,我们需要能够安全地处理所有相处场景,这些可变性让人跃跃欲试。​

到这里,我们也就讲完了《机器人落地「秘诀」:持续学习、知识迁移和自主参与》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于机器人,亚马逊,挑战的知识点!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
AI客服替代优势尽显 需求匹配与普及应用尚待时日AI客服替代优势尽显 需求匹配与普及应用尚待时日
上一篇
AI客服替代优势尽显 需求匹配与普及应用尚待时日
深度学习十年后是撞墙了吗?Hinton、LeCun、李飞飞可不这么认为
下一篇
深度学习十年后是撞墙了吗?Hinton、LeCun、李飞飞可不这么认为
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    11次使用
  • SEO标题PetGPT:智能桌面宠物程序,结合AI对话的个性化陪伴工具
    PetGPT
    SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
    11次使用
  • 可图AI图片生成:快手可灵AI2.0引领图像创作新时代
    可图AI图片生成
    探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
    41次使用
  • MeowTalk喵说:AI猫咪语言翻译,增进人猫情感交流
    MeowTalk喵说
    MeowTalk喵说是一款由Akvelon公司开发的AI应用,通过分析猫咪的叫声,帮助主人理解猫咪的需求和情感。支持iOS和Android平台,提供个性化翻译、情感互动、趣味对话等功能,增进人猫之间的情感联系。
    38次使用
  • SEO标题Traini:全球首创宠物AI技术,提升宠物健康与行为解读
    Traini
    SEO摘要Traini是一家专注于宠物健康教育的创新科技公司,利用先进的人工智能技术,提供宠物行为解读、个性化训练计划、在线课程、医疗辅助和个性化服务推荐等多功能服务。通过PEBI系统,Traini能够精准识别宠物狗的12种情绪状态,推动宠物与人类的智能互动,提升宠物生活质量。
    35次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码