无人机竞速超越人类顶级选手,强化学习再度震撼Nature封面
有志者,事竟成!如果你在学习科技周边,那么本文《无人机竞速超越人类顶级选手,强化学习再度震撼Nature封面》,就很适合你!文章讲解的知识点主要包括,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~
在最近的一场无人机比赛中,一架经过自主控制的无人机成功击败了顶级人类玩家
这架自主控制无人机是由瑞士苏黎世大学的研究团队设计研发的 Swift 系统,研究成果登上了最新一期的《Nature》杂志封面
研究内容:请点击此链接查阅研究详情:https://www.nature.com/articles/s41586-023-06419-4
在这个无人机比赛中,人类操作员通过搭载的摄像头来操控无人机在3D赛道上飞行,这样可以让操作员从无人机的视角来观察环境。使无人机达到人类操控的水平对于自主无人机来说是非常具有挑战性的,因为无人机需要仅仅通过搭载的传感器来估计自己在赛道上的速度和位置
Swift战胜了世界冠军级的人类玩家,他们分别是2019年无人机竞速联盟世界冠军Alex Vanover、两届MultiGP国际公开赛冠军Thomas Bitmatta和三届瑞士全国冠军Marvin Schaepper
以下是需要改写的内容:下图1a展示了比赛的赛道,Swift不仅在与人类冠军的比赛中获胜,还创造了最快的比赛纪录。这个成就标志着移动机器人和机器智能领域的一个重要里程碑
需要重新写作的内容是:图1
我们接下来将探讨一下自主无人机 Swift 的技术方法
Swift 技术介绍
Swift 是一款四旋翼飞行器,它通过机载传感器和计算来实现自主控制。这款飞行器由两个关键模块构成:
- 感知系统,将高维的视觉和惯性信息转换成低维表征;
- 控制策略,摄取感知系统产生的低维表征并产生控制命令。
在这个研究中,使用一个前馈神经网络来表达控制策略,并且使用无模型的on-policy深度强化学习方法进行训练
由于模拟与现实世界在传感和动力学方面存在差异,仅在模拟中优化策略会导致无人机的现实性能较差,因此研究团队利用物理系统收集的数据来估计非参数经验噪声模型。实验表明,这些经验噪声模型有助于将控制策略从模拟成功转移到现实
具体来说,Swift将机载传感器的读数映射成控制命令,这一映射包括两部分:(1)观察策略,将高维的视觉和惯性信息提炼成特定于任务的低维编码;(2)控制策略,将编码转换成无人机命令。Swift系统整体概览如下图2所示
需要重写的内容是:图2
如需要重新写作的内容是:图1 所示场景,Swift 的观察策略需要运行视觉 - 惯性估计器和门检测器。其中,门检测器是一个卷积神经网络,用于检测机载图像中的赛车门,然后使用检测到的门来估计无人机在赛道上的全局位置和飞行方向。这是使用相机后方交会算法(camera-resectioning algorithm),并结合赛道地图来完成的。最后,Swift 用卡尔曼滤波(Kalman filter)将全局姿态估计(从门检测器获得)与视觉 - 惯性估计结合起来,从而更准确地表征机器人的状态。
重写后的内容:使用一个两层感知器来控制策略,将卡尔曼滤波的输出映射为无人机的控制指令。该控制策略通过在模拟环境中使用无模型的on-policy深度强化学习进行训练。在训练过程中,该策略会考虑相机视野内下一个竞赛门的信息,并通过最大化奖励来提高姿态估计的准确性
实验及结果
为了评估Swift的性能,这项研究进行了一系列的比赛实验,并与轨迹规划和模型预测控制(MPC)进行了比较
根据图3b所示,在与A. Vanover进行的9场比赛中,Swift赢了5场;在与T. Bitmatta进行的7场比赛中,Swift赢了4场;在与M. Schaepper进行的9场比赛中,Swift赢了6场。在Swift的10次失利中,40%是因为与对手相撞,40%是因为与竞赛门相撞,20%是因为比人类控制的无人机慢。总体而言,在与人类控制无人机进行的比赛中,Swift获胜次数最多,并且它还创造了最快的比赛纪录,比人类控制无人机(A. Vanover)的最佳时间快了半秒
需要重新书写的内容是:图3
为了对 Swift 的性能进行更详细的分析,该研究比较了 Swift 和人类控制的无人机在最快单圈飞行速度方面的表现。结果如下需要进行改写的内容是:图4 和需要被重写的是:表 1 所示
需要进行改写的内容是:图4
需要被重写的是:表 1
虽然从整体上看,Swift 比所有人类控制无人机都要快,但它在赛道的每个赛段上的速度并不快,如需要被重写的是:表 1 所示。
研究团队仔细分析发现:在起飞时,Swift 的反应时间较短,平均比人类飞行员早 120 毫秒起飞;Swift 的加速也更快,进入第一个竞赛门时速度更高。在急转弯时,如需要进行改写的内容是:图4cd 所示,Swift 的动作更加紧凑。
研究团队还提出了一种假设,即Swift在比人类操控者更长的时间尺度上优化轨迹。众所周知,无模型强化学习可以通过优化长期奖励来进行价值函数优化。相反,人类操控者规划运动的时间尺度较短,最多只能预测未来一个竞赛门
今天关于《无人机竞速超越人类顶级选手,强化学习再度震撼Nature封面》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于模型,训练的内容请关注golang学习网公众号!

- 上一篇
- MySQL视图在哪些地方可能会不一致,如何保证它们的一致性?

- 下一篇
- 快速训练小型专业模型:只需1句指令、5美元和20分钟,体验Prompt2Model!
-
- 科技周边 · 人工智能 | 1小时前 |
- 小鹏P7Ultra与G7谍照对比:风格大不同
- 114浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- AI证件照如何变得更真实?
- 392浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 | AI基础设施 a轮融资 1亿美元 TensorWave AMDGPU
- TensorWave获AMD领投1亿美元A轮融资
- 215浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 | 碳纳米管/硅异质集成 3DCMOS 低温集成 噪声容限 超低功耗
- 碳硅三维集成新突破,中国科学院微电子所最新进展
- 196浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 豆包AI神器实测:提升评论互动率神回复秘籍
- 270浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 魔匠AI
- SEO摘要魔匠AI专注于高质量AI学术写作,已稳定运行6年。提供无限改稿、选题优化、大纲生成、多语言支持、真实参考文献、数据图表生成、查重降重等全流程服务,确保论文质量与隐私安全。适用于专科、本科、硕士学生及研究者,满足多语言学术需求。
- 10次使用
-
- PPTFake答辩PPT生成器
- PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
- 26次使用
-
- Lovart
- SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
- 25次使用
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 34次使用
-
- PetGPT
- SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
- 36次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览