AI无人机超越人类冠军,Nature封面:将AlphaGo的突破应用于现实世界
科技周边小白一枚,正在不断学习积累知识,现将学习到的知识记录一下,也是将我的所得分享给大家!而今天这篇文章《AI无人机超越人类冠军,Nature封面:将AlphaGo的突破应用于现实世界》带大家来了解一下##content_title##,希望对大家的知识积累有所帮助,从而弥补自己的不足,助力实战开发!
AI再次战胜人类世界冠军,荣登《自然》封面
与上一次AlphaGo下围棋不同,这次是在真实物理环境中的竞技体育项目——“空中F1”无人机竞速,而不是脑力运动
与AlphaGo相似的是,核心技术都是深度强化学习
苏黎世大学的研究成果,由Davide Scaramuzza等人共同完成。他们认为,这一成果对国际象棋和围棋来说,是继深蓝和AlphaGo之后的又一次重大突破
这意味着自主移动机器人第一次在由人类设计并为人类设计的物理环境体育运动中战胜了人类冠军
微软高级研究工程师Shital Shah表示,这个挑战比AlphaGo更具挑战性,也更难以获得认可,但它仍然是一个具有历史意义的里程碑
深度强化学习,又一次胜利
首先,让我们来介绍一下这个运动项目:FPV(第一人称视角)无人机竞速
人类选手将通过从机载摄像头传输的视频,以无人机的视角观察环境,并穿越障碍物
赛道由七个方形大门组成,参赛者必须按照顺序通过每一圈。为了赢得比赛,参赛者必须连续领先对手并完成三圈
两台无人机同时出发,进行正面对决,最高速度可达每小时100公里,同时承受数倍于重力的加速度
参加这次与AI同台的比赛的选手包括2019年无人机竞速联盟世界冠军Alex Vanover、MultiGP国际公开赛世界杯冠军Thomas Bitmatta和三届瑞士全国冠军Marvin Schaepper
对于人工智能来说,要达到专业人类选手的水平非常具有挑战性。这是因为无人机需要在物理极限下飞行,并且仅通过机载传感器来估计速度和位置
为了应对这些挑战,苏黎世大学开发了Swift,这个项目由两个关键模块构成:
- 感知系统,将高维视觉信息和惯性信息转换为低维表示。
- 控制策略,感知系统产生的低维表示并产生控制命令。
其中,感知系统的主要组成部分是一个VIO(Visual-Inertial Odometry)模块,该模块利用视觉和惯性传感器来实现自身定位和环境建模
VIO估计与神经网络相结合,用于检测障碍门的四个角点。 将VIO估计与神经网络结合,可以用来检测障碍门的四个角点
控制策略采用无模型的On-policy深度强化学习,通过模拟训练使用前馈神经网络。奖励目标结合了向下一个门的中心前进以及保持下一个门在摄像机视野内
为了弥合模拟和物理世界之间在感知和动力学方面的差距,我们采用了从物理系统中收集的数据,来驱动一个MLP残差模型
在比赛开始前,人类选手有一周的练习时间在指定赛道上进行训练。这个赛道包含了一些高难度的机动动作,比如“Split-S”
比赛的具体规则如下:比赛将由声学信号(发令枪)开始,即使发生碰撞,比赛仍可继续进行。如果两架无人机都坠落,那么飞得更远的一方将获胜
在与三位人类选手的比赛中,Swift最终取得了9局5胜、7局4胜和9局6胜的成绩
在Swift输掉的比赛中,有40%是因为与对手发生碰撞,40%是因为与门发生碰撞,20%是因为速度比人类慢。 需要被改写的内容是:在Swift输掉的比赛中,有40%是因为与对手发生碰撞,40%是因为与门发生碰撞,20%是因为速度比人类慢。 改写后的内容是:在Swift失败的比赛中,有40%是因为与对手发生碰撞,40%是因为与门发生碰撞,20%是因为速度比人类慢
在比赛中,Swift继续创造最快记录,人类选手的最佳时间落后半秒
在累计300圈的数据中,Swift的平均时间更短,方差更低,这表明AI在每一圈都稳定地追求更快的圈速
当人类处于领先地位时,他们会选择保持较慢的速度,以降低碰撞的风险,并展现更大的差异性
当前的Swift系统存在一个问题,就是无法准确了解对手的情况。当我们处于领先时,系统表现得不够稳定;而当我们落后时,系统又不够灵活应对
AI与人类选手,哪里不同?
在研究报告中,团队还进一步探讨了人工智能与人类选手之间的更多比较
首先,Swift利用了机载惯性传感器,这类似于人类的前庭系统
然而,人类在这个项目中无法使用前庭系统,因为他们无法随无人机一起移动,无法感受到加速度
此外,Swift的传感器延迟仅为40毫秒,而专业人类选手的平均反应时间为220毫秒
然而,Swift的摄像头刷新率受限,只有30Hz,而人类使用的摄像头则是120Hz
最终,人类的韧性得到了提升
举个例子,即使在全速坠机的情况下,只要设备没有损坏,比赛就可以继续进行。然而,Swift并没有接受过碰撞后恢复的训练
如果改变比赛现场的光照环境,Swift的感知系统就会无法正常工作
该研究可能会激发在其他物理系统(例如自动驾驶汽车、飞机和机器人)中广泛应用基于混合学习的解决方案
请点击以下链接查看论文:https://www.nature.com/articles/s41586-023-06419-4
参考链接:[1]https://x.com/davsca1/status/1696938013421429111
以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于科技周边的相关知识,也可关注golang学习网公众号。

- 上一篇
- 探索如何测量 Apple Watch 在手腕上的数据

- 下一篇
- 寻找元宇宙发展的关键点:运营商如何准确把握?
-
- 科技周边 · 人工智能 | 2小时前 |
- LongPortMCP—长桥集团首推券商新品
- 121浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 通用汽车CEO2024年薪酬近3000万,涨幅达6%
- 438浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 | 控制面板 ccleaner 卸载程序 AI豆包 RevoUninstaller
- 电脑AI豆包删除攻略及详细步骤
- 118浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 2025Q1中国车市占33%,国际品牌大跌
- 255浏览 收藏
-
- 科技周边 · 人工智能 | 7小时前 |
- 问界M8大定破6万:35.98万起,华为ADS3.0加持
- 194浏览 收藏
-
- 科技周边 · 人工智能 | 16小时前 | LGDisplay 蓝色磷光OLED 功耗降低 混合双栈串联OLED
- LG蓝色磷光OLED面板首发,手机功耗降15%
- 367浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 毕业宝AIGC检测
- 毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
- 9次使用
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 26次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 21次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 26次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 26次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览