当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 陪跑又快又稳,机器人跑步搭子来了

陪跑又快又稳,机器人跑步搭子来了

来源:机器之心 2024-04-10 21:18:16 0浏览 收藏

今天golang学习网给大家带来了《陪跑又快又稳,机器人跑步搭子来了》,其中涉及到的知识点包括等等,无论你是小白还是老手,都适合看一看哦~有好的建议也欢迎大家在评论留言,若是看完有所收获,也希望大家能多多点赞支持呀!一起加油学习~

这个机器人名叫Cassie,曾经创下百米跑世界纪录。最近,加州大学伯克利分校的研究者给它开发了一种新的深度强化学习算法,让它掌握了急转弯等技能,还能对抗各种干扰。

陪跑又快又稳,机器人跑步搭子来了                                                                              【关注本站视频号,第一时间看到有趣的 AI 内容】
关于双足机器人运动的研究已经进行了几十年,但仍然没有一个能够对各种运动技能进行稳健控制的通用框架。挑战来自于双足机器人欠驱动动态的复杂性以及与每种运动技能相关的不同规划。

研究者们希望解决的关键问题在于:如何为高维人体大小的双足机器人开发一种解决方案?如何控制多样化、敏捷和稳健的腿部运动技能,比如行走、跑步和跳跃?

最近的一项研究或许提供了不错的方案。

在这项工作中,来自伯克利等机构的研究者利用强化学习(RL)为现实世界中的高维非线性双足机器人创建控制器,以应对上述挑战。这些控制器可以利用机器人的本体感觉信息来适应随时间变化的不确定动态,同时能够适应新的环境和设置,利用双足机器人的敏捷性,在突发情况下表现出稳健的行为。此外,本文框架还提供了再现各种双足运动技能的通用配方。
陪跑又快又稳,机器人跑步搭子来了
  • 论文标题:Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control
  • 论文链接:https://arxiv.org/pdf/2401.16889.pdf

论文细节

对于控制器来说,扭矩控制人体大小的双足机器人的高维性和非线性乍似乎是障碍,然而这些特性的优势在于可以通过机器人的高维动力学实现复杂的敏捷操作。

这一控制器赋予机器人的技能如图 1 所示,包括稳健的站立、行走、奔跑和跳跃。这些技能还可用于执行各种不同的任务,包括以不同速度和高度行走、以不同速度和方向奔跑以及跳向各种目标,同时在实际部署过程中保持稳健性。为此,研究者利用无模型 RL 让机器人通过对系统全阶动态的试错来学习。除了真实世界的实验,还深入分析了使用 RL 进行腿部运动控制的好处,并详细研究了如何有效地构建学习过程以利用这些优势,如适应性和稳健性。
陪跑又快又稳,机器人跑步搭子来了
用于通用双足运动控制的 RL 系统如图 2 所示:
陪跑又快又稳,机器人跑步搭子来了
第四节首先介绍了在运动控制中利用机器人 I/O 历史记录的重要性,这一节从控制和 RL 两个角度展示了机器人的长期 I/O 历史可以在实时控制过程中实现系统识别和状态估计。

第五节介绍了研究的核心:一种利用双足机器人长期和短期 I/O 双历史记录的新型控制架构。具体来说,这种控制架构不仅能利用机器人的长期历史记录,还能利用机器人的短期历史记录。

控制框架如下图:
陪跑又快又稳,机器人跑步搭子来了
在这种双历史记录结构中,长期历史记录带来了适应性(在第八节中得到验证),短期历史记录则通过实现更好的实时控制对长期历史记录的利用进行了补充(在第七节中得到验证)。

第六节介绍了如何将由深度神经网络表示的控制策略通过无模型 RL 进行优化。鉴于研究者旨在开发一种能够利用高动态运动技能完成各种任务的控制器,因此这一节中的训练以多阶段模拟训练为特征。这种训练策略提供了一个结构化的课程,首先是单一任务训练,即机器人专注于一个固定的任务,然后是任务随机化,使机器人接受的训练任务多样化,最后是动态随机化,改变机器人的动态参数。

策略如下图所示:
陪跑又快又稳,机器人跑步搭子来了
这种训练策略能够提供一种多功能控制策略,可以执行多种任务,并实现机器人硬件的零样本迁移。此外,任务随机化还能通过在不同的学习任务中进行泛化来增强所产生策略的稳健性。

研究表明,这种稳健性可以使机器人对干扰做出顺从的行为,这与动态随机化带来的干扰是「正交」的。这一点将在第九节中得到验证。

利用这一框架,研究者获得了针对双足机器人 Cassie 的行走、跑步和跳跃技能的多功能策略。第十章评估了这些控制策略在现实世界中的有效性。

实验

研究者对机器人进行了广泛的实验,包括在现实世界中行走、跑步和跳跃等多项能力的测试。所用策略在经过模拟训练后都能够有效地控制现实世界中的机器人,而无需进一步调整。

行走实验

如图 14a 所示,行走策略展示了对机器人遵循不同指令的有效控制,在整个测试过程中,跟踪误差相当低(跟踪误差由 MAE 的值来评估)。 

此外,机器人策略在较长时间内始终表现良好,即使在 325 天和 492 天后仍具有保持跟踪可变命令的能力,分别如图 14c 和图 14b 所示。尽管在此期间机器人的动力学发生了显著的累积变化,但图 14a 中的同一控制器继续有效地管理不同的行走任务,并且跟踪误差的退化最小。
陪跑又快又稳,机器人跑步搭子来了
如图 15 所示,该研究所用的策略显示出对机器人可靠的控制,使机器人能够准确地跟踪顺时针或逆时针的不同转弯命令。
陪跑又快又稳,机器人跑步搭子来了
快速行走实验。除了中等行走速度之外,实验还展示了所用策略控制机器人向前和向后执行快速行走动作的能力,如图 16 所示。机器人可以从静止状态过渡到快速实现向前行走速度,平均速度达到 1.14 m/s(跟踪指令中要求 1.4 m/s),机器人还能按照指令快速返回站立姿态,如图 16a 所示,数据记录在图 16c 中。
陪跑又快又稳,机器人跑步搭子来了
在不平坦的地形上(未经训练),机器人也可以在楼梯或下坡上有效地向后行走,如下图所示。
陪跑又快又稳,机器人跑步搭子来了
抗扰动。在脉冲扰动的情况下,比如研究者在机器人步行时从各个方向向机器人引入了短时间内的外部扰动。就像图 18a 中记录的那样,在原地行走时向机器人施加相当大的横向扰动力,横向速度峰值为 0.5 m/s。尽管有扰动,机器人仍能迅速从横向偏差中恢复过来。如图 18a 所示,机器人熟练地沿相反的横向方向移动,有效地补偿扰动并恢复其稳定的原地行走步态。
陪跑又快又稳,机器人跑步搭子来了
在持续扰动测试期间,人类对机器人底座施加扰动力量,并沿随机方向拖动机器人,同时命令机器人原地行走。如图 19a 所展示的,当机器人正常行走时,持续的横向拖力施加到 Cassie 的底座上。结果显示机器人在不失去平衡的情况下,通过遵循这些外力的方向来表现出对这些外力的顺应性。这也表明了本文提出的基于强化学习的策略在控制双足机器人以实现安全人机交互等潜在应用方面的优势。

跑步实验

当机器人使用双足跑步策略,在 2 分 34 秒内实现了 400 米冲刺,在 27.06 秒内实现了 100 米冲刺,跑步倾斜度高达 10° 等等。

400 米短跑:该研究首先评估了在标准室外跑道上完成 400 米短跑的一般跑步策略,如图 20 所示。在整个测试过程中,机器人被命令以 3.5 m/s 的速速同时响应由操作员发出的不同转弯命令。机器人能够从站立姿态平滑地过渡到跑步步态(图 20a 1)。机器人设法加速到平均估计运行速度 2.15 m/s,达到峰值估计速度 3.54 m/s,如图 20b 所示。该策略使机器人成功地在整个 400 米跑步过程中始终保持所需的速度,同时准确地遵守不同的转弯命令。
陪跑又快又稳,机器人跑步搭子来了
在所提出的跑步策略的控制下,Cassie 在 2 分 34 秒内成功完成了 400 米冲刺,随后能够过渡到站立姿态。 

该研究进一步进行了急转弯测试,其中机器人被给予偏航命令的阶跃变化,从 0 度直接到 90 度,如图 21c 中记录的。机器人可以响应这样的步进命令,并在 2 秒 5 步内完成 90 度急转弯。
陪跑又快又稳,机器人跑步搭子来了
100 米短跑:如图 22 所示,通过部署所提出的跑步策略,机器人在大约 28 秒内完成了 100 米短跑,实现了 27.06 秒的最快跑步时间。
陪跑又快又稳,机器人跑步搭子来了
跳跃实验

通过实验证明,研究者发现很难训练机器人在跳跃到高架平台的同时同时转弯,但所提出的跳跃策略实现了机器人多种不同的双足跳跃,包括可以跳跃 1.4 米以及跳到 0.44 米高架平台上。

跳跃和转弯:如图 25a 所示,使用单次跳跃策略,机器人能够执行各种给定的目标跳跃,例如旋转 60° 时原地跳跃、向后跳跃到后面 0.3 米处着陆等。 
陪跑又快又稳,机器人跑步搭子来了
跳跃到高架平台:如图 25b 所示,机器人能够精确跳跃到不同位置的目标上,例如前方 1 米或前方 1.4 米,它还能跳到不同高度的位置,包括跳到 0.44 米高的地方(考虑到机器人本身只有 1.1 米高)。

了解更多内容,请参考原论文。

以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于科技周边的相关知识,也可关注golang学习网公众号。

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
苹果mac链接蓝牙鼠标(macbookpro蓝牙连接鼠标)苹果mac链接蓝牙鼠标(macbookpro蓝牙连接鼠标)
上一篇
苹果mac链接蓝牙鼠标(macbookpro蓝牙连接鼠标)
Go 中处理动态字段时如何解组
下一篇
Go 中处理动态字段时如何解组
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    7次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    7次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    6次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    13次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    14次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码