上交大校友获最佳论文,机器人顶会CoRL 2022奖项公布
今天golang学习网给大家带来了《上交大校友获最佳论文,机器人顶会CoRL 2022奖项公布》,其中涉及到的知识点包括等等,无论你是小白还是老手,都适合看一看哦~有好的建议也欢迎大家在评论留言,若是看完有所收获,也希望大家能多多点赞支持呀!一起加油学习~
自 2017 年首次举办以来,CoRL 已经成为了机器人学与机器学习交叉领域的全球顶级学术会议之一。CoRL 是面向机器人学习研究的 single-track 会议,涵盖机器人学、机器学习和控制等多个主题,包括理论与应用。
2022年的CoRL大会于12月14日至18日在新西兰奥克兰举行。
本届大会共收到504篇投稿,最终接收34篇Oral论文、163篇Poster论文,接收率为39%。
目前,CoRL 2022 公布了最佳论文奖、最佳系统论文奖、特别创新奖等全部奖项。宾夕法尼亚大学GRASP实验室硕士、上海交通大学校友Kun Huang获得了大会最佳论文奖。
最佳论文奖
获得本届大会最佳论文奖的是来自宾夕法尼亚大学的一项研究。
- 论文标题:Training Robots to Evaluate Robots: Example-Based Interactive Reward Functions for Policy Learning
- 作者:Kun Huang、Edward Hu、Dinesh Jayaraman
- 论文链接:https://openreview.net/pdf?id=sK2aWU7X9b8
论文摘要:通常来说,物理相互作用有助于揭示不太明显的信息,例如我们可能会拉一下桌腿来评估它是否稳固,或者把一个水瓶倒过来检查它是否漏水,该研究建议可以通过训练机器人来自动获得这种交互行为,以评估机器人尝试执行技能的结果。这些评估反过来作为IRF(interactive reward functions),用于训练强化学习策略以执行目标技能,例如拧紧桌腿。此外,即使完全训练完成之后,IRF也可以作为改进在线任务执行的验证机制。对于任何给定的任务, IRF训练非常方便,并且不需要进一步的规范。
评估结果表明,IRF 可以实现显着的性能改进,甚至可以通过访问演示或精心设计的奖励来超越基线。比如下图中,机器人必须先关门,然后旋转对称的门把手才能完全锁住门。
门锁(door locking)评估示例演示
下面实验的目的是将 3 个视觉上相同的块堆叠成一个稳定的塔,其中的一个小方块明显比其他两块重,所以最佳策略是将它放在底部。
堆叠评估示例演示
为了检查算法的鲁棒性和通用性,该研究使用具有 9 个关节的 D'Claw 在真实机器人拧紧实验中对其进行测试。此任务的目的是将4-prong阀门顺时针旋转约 180° 进入拧紧状态(阀门底座上的白线)。
作者介绍
本次获得CoRL 2022最佳论文奖的作者共有三位,分别是Kun Huang、Edward Hu、Dinesh Jayaraman 。
Dinesh Jayaraman为宾夕法尼亚大学GRASP实验室的助理教授,他领导着感知、行动和学习(PAL)研究小组,致力于计算机视觉、机器学习和机器人技术的交叉问题研究。
Kun Huang为宾夕法尼亚大学GRASP实验室硕士,在Dinesh Jayaraman教授的指导下研究强化学习。他在密歇根大学获得了计算机科学学士学位,在那里他与 Dmitry Berenson 教授一起研究机器人感知。Kun Huang本科毕业于上海交通大学,研究兴趣包括机器人与现实世界的应用。Kun Huang 在硕士期间曾在 Waymo 实习,毕业后将加入 Cruise 担任机器学习工程师。
领英主页:https://www.linkedin.com/in/kun-huang-620034171/
Edward S. Hu 为宾夕法尼亚大学GRASP实验室的博士生,师从Dinesh Jayaraman教授。他的主要研究兴趣包括基于模型的强化学习等。Edward在南加州大学获得了计算机科学硕士和学士学位,在那里他与Joseph J. Lim教授一起研究机器人的强化和模仿学习。
最佳论文入围名单
此次会议共有3篇论文入围最佳论文奖项,除了最终得奖的论文以外,其他2篇分别是:
- 论文标题:Learning Agile Skills via Adversarial Imitation of Rough Partial Demonstrations
- 作者:Chenhao Li、Marin Vlastelica、Sebastian Blaes、Jonas Frey、Felix Grimminger、Georg Martius
- 论文链接:https://arxiv.org/pdf/2206.11693.pdf
- 论文标题:Supercharging Imitation with Regularized Optimal Transport
- 作者:Siddhant Haldar 、 Vaibhav Mathur、Denis Yarats、Lerrel Pinto
- 论文链接:https://arxiv.org/pdf/2206.15469.pdf
最佳系统论文奖
获得本届大会最佳系统论文奖的是来自CMU、UC伯克利的一项研究。
- 论文标题:Legged Locomotion in Challenging Terrains using Egocentric Vision
- 作者:Ananye Agarwal,Ashish Kumar,Jitendra Malik, Deepak Pathak
- 论文链接:https://arxiv.org/pdf/2211.07638.pdf
论文摘要:动物能够利用视觉进行精确而敏捷的运动,而复制这种能力一直是机器人技术的一个长期目标。传统的方法是将这个问题分解为海拔测绘和落脚点规划阶段(foothold planning phase)。然而,海拔测绘很容易受到故障和大面积噪声的影响,需要专门的硬件而且在生物学上是不可行的。
在本文中,研究者提出了第一个能够穿越楼梯、路边、垫脚石和空隙的端到端运动系统,并在一个中等大小、使用单个正面的深度摄像头的四足机器人上展示了这一结果。由于机器人体积小,需要发现其他地方没有的专门的步态模式。摄像头需要掌握记住过去的信息的策略,以估计身后脚下的地形。
研究者在模拟环境中训练了机器人的策略。训练分为两个阶段:首先使用强化学习训练一个具有低计算成本的深度图像变体的策略,然后将其提炼为使用监督学习的深度的最终策略。
最终的策略可迁移到现实世界,并能够在机器人有限的计算能力上实时运行。它可以穿越大量的地形,同时对诸如湿滑表面和岩石地形等干扰具有鲁棒性。
垫脚石和空隙
机器人能够跨过各种配置的吧台凳,并调整步长以跨过大间隙。由于后脚附近没有摄像头,机器人必须记住吧台凳的位置并在相应的位置放置后脚。
楼梯和路边
该机器人能够爬上24厘米高、30厘米宽的楼梯。策略适用于各种照明条件下的不同楼梯和路边。在分布不均匀的楼梯,机器人最初会被卡住,但最终能够使用爬升行为跨过这些障碍。
非结构化地形
机器人可以穿越不属于其训练类别之一的非结构化地形,显示了系统的泛化能力。
黑暗中的移动
深度相机使用红外光投射图案,即使在几乎没有环境光的情况下也能准确估计深度。
鲁棒性
策略对大力量(从高处投掷 5 公斤重物)和湿滑表面(水倒在塑料布上)具有鲁棒性。
作者介绍
这项研究共有四位作者。
Jitendra Malik现为UC伯克利电气工程和计算机科学系Arthur J. Chick教授,他的研究领域包括计算机视觉、人类视觉的计算建模、计算机图形学和生物图像分析等。
本次获奖研究的作者之一Ashish Kumar是他的博士生。
Deepak Pathak现为卡内基梅隆大学助理教授,他在加州大学伯克利分校获得博士学位,研究的主题包括机器学习、机器人和计算机视觉。
本次获奖研究的作者之一Ananye Agarwal是他的博士生。
此外,Deepak Pathak还有一项研究在本次大会最佳系统论文奖的入围名单之内。
- 论文标题:Deep Whole-Body Control: Learning a Unified Policy for Manipulation and Locomotion
- 作者:Zipeng Fu, Xuxin Cheng, Deepak Pathak
- 论文链接:https://arxiv.org/abs/2210.10044
特别创新奖
这次大会还评选出了特别创新奖,这项研究由谷歌的多位研究者共同完成。
- 论文标题:Do As I Can, Not As I Say: Grounding Language in Robotic Affordances
- 作者:Brian Ichter 、 Anthony Brohan 、Michael Ahn 等
- 论文链接:https://arxiv.org/pdf/2204.01691.pdf
论文摘要:大型语言模型可以编码关于世界的大量语义知识,这样的知识对机器人非常有用。然而,语言模型存在这样一个缺点,即对真实世界缺乏经验,这使得其在给定任务上很难利用语义进行决策。
来自谷歌的研究者建议通过预训练技能来提供大型语言模型在现实世界的基础,这些技能用于约束模型,以提出既可行又适合上下文的自然语言操作。机器人可以充当语言模型的「手和眼睛」,而语言模型提供关于任务的高级语义知识。该研究展示了低级技能如何与大型语言模型相结合,以便语言模型提供有关执行复杂和时间扩展指令的过程的高级知识,而与这些技能相关的值函数提供了将这些知识连接到特定物理环境所需的基础。
研究者将大型语言模型(LLM)与机器人的物理任务组合到一起时用到了这样一个原则:除了让 LLM 简单地解释一条指令之外,还可以用它来评估单个动作对完成整个高级指令有帮助的概率。简单来说,每个动作可以有一个语言描述,我们可以通过 prompt 语言模型让它给这些动作打分。此外,如果每个动作都有一个相应的 affordance 函数,可以量化它从当前状态(比如学到的价值函数)获得成功的可能性。两个概率值的乘积就是机器人能成功地完成一个对于指令有帮助的动作的概率。根据这个概率将一系列动作排序,选取概率最高的一个。
下图示例展示的是机器人帮助拿苹果:
好了,本文到此结束,带大家了解了《上交大校友获最佳论文,机器人顶会CoRL 2022奖项公布》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多科技周边知识!

- 上一篇
- Windows 11 开发频道内部版本 22557 中的任务管理器

- 下一篇
- 边缘人工智能的梦想与挑战
-
- 科技周边 · 人工智能 | 2分钟前 |
- 福特再召回超千万辆!美国车主怒了:就为这倒车影像?
- 296浏览 收藏
-
- 科技周边 · 人工智能 | 19分钟前 |
- DeepSeek+Trello:手把手教你用AI搞定任务管理
- 475浏览 收藏
-
- 科技周边 · 人工智能 | 21分钟前 |
- Cursor+DeepSeek双剑合璧,代码生成&异常处理真香了!
- 125浏览 收藏
-
- 科技周边 · 人工智能 | 26分钟前 |
- 短视频玩家看过来!DeepSeek+抖音脚本一键生成超简单
- 246浏览 收藏
-
- 科技周边 · 人工智能 | 27分钟前 |
- AI修复老照片变证件照,超简单教程分享!
- 407浏览 收藏
-
- 科技周边 · 人工智能 | 37分钟前 |
- 即梦AI快闪视频&节奏切换功能超详细教学,这样玩才够酷!
- 472浏览 收藏
-
- 科技周边 · 人工智能 | 40分钟前 |
- 快影接入DeepSeek-R1,手把手教你AI生成视频+多语言配音!
- 432浏览 收藏
-
- 科技周边 · 人工智能 | 46分钟前 |
- 搞图教程!DeepSeek+Canva打造个性AI设计模板
- 469浏览 收藏
-
- 科技周边 · 人工智能 | 47分钟前 |
- 通灵义码新手必看!3步轻松搞定基础用法
- 209浏览 收藏
-
- 科技周边 · 人工智能 | 56分钟前 |
- 豆包AI玩转明星表情包,日增粉2000+的涨粉神器!
- 203浏览 收藏
-
- 科技周边 · 人工智能 | 59分钟前 |
- 10分钟速成!DeepSeek生成古风插画+阴阳怪气文案,轻松爆粉神器!
- 269浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 6次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 9次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 6次使用
-
- Suno苏诺中文版
- 探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
- 8次使用
-
- PicDoc
- PicDoc,AI驱动的文本转视觉平台,轻松将文字转化为专业图表、思维导图、PPT图例。免费试用,无需下载,提升职场汇报、教学资料、文章配图等场景的表达力。
- 7次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览