当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 索尼AI击溃顶级真人赛车手,以1.5秒优势打败人类

索尼AI击溃顶级真人赛车手,以1.5秒优势打败人类

来源:51CTO.COM 2023-04-27 12:35:42 0浏览 收藏

从现在开始,努力学习吧!本文《索尼AI击溃顶级真人赛车手,以1.5秒优势打败人类》主要讲解了等等相关知识点,我会在golang学习网中持续更新相关的系列文章,欢迎大家关注并积极留言建议。下面就先一起来看一下本篇正文内容吧,希望能帮到你!

索尼AI击溃顶级真人赛车手,以1.5秒优势打败人类

“这是什么情况?”艾米丽·琼斯(Emily Jones)不敢相信自己竟然落后了。

艾米丽·琼斯是一名多次夺冠的顶级 GT 游戏赛车手,她拍打着她的电子竞技专用方向盘,眼睛盯着面前的屏幕:“我尽力了,但还是追不上它——它是怎么做到的?”

在游戏 GT(Gran Turismo)中,琼斯以每小时 120 英里的速度驾驶着她的赛车。为了追上世界上最快的“玩家”,她几度把车速飙到了每小时 140、150 英里。

这位“玩家”实际上是名为 GT Sophy 的人工智能。它是由索尼人工智能研究实验室在 2020 年发布的,利用人工智能技术在 GT 游戏中学习如何操控赛车。在 2021 年举行的一系列闭门活动中,索尼安排了该人工智能与顶尖 GT 赛车手同台竞技。

2021 年 7 月,琼斯作为电竞战队 Trans Tasman Racing 的一员,参与了索尼组织的活动,但当时的她并不知道会发生什么。

“没人给我提供任何信息。只是跟我说不需要做任何练习,也不要在意圈速。”她回忆道。“我的态度也很单纯,保密就保密吧,这肯定不是什么坏事。”

最后,GT Sophy 以 1.5 秒的优势击败了琼斯的最佳成绩——人类赛车手刷新 GT 纪录基本都是以毫秒为单位的,1.5 秒意味着巨大的差距。

但索尼很快了解到,仅凭速度并不足以让 GT Sophy 成为赢家。它在单人赛道上超越了人类车手,以不可思议的成绩打破了三个不同赛道的纪录。

然而当索尼将其与多个人类车手放在一起比赛时,它却输掉了——多人竞赛不仅需要速度,还需要一定的智慧。GT Sophy 有时因过于激进和鲁莽而招来罚分,有时则过于怯懦,在不需要的时候让步。

索尼重新训练了人工智能,并在 2021 年 10 月进行了第二轮比赛。这一次,GT Sophy 轻松地赢下了人类玩家。它做出了什么改变?

首先是索尼打造了一个更大的神经网络,程序的性能更加强大,但本质上的不同之处在于 GT Sophy 学会了“赛道礼仪”。

美国负责人彼得·沃曼()表示,这种礼仪被人类车手广泛遵守,其实质是平衡攻击性和让步的能力,在时刻变化的赛场中动态选择最合适的行为。

这也是使 GT Sophy 超越赛车游戏人工智能的原因。他说,车手在赛道上的互动和礼节是一个特殊例子,其中展示的动态的、情境感知的行为,正是机器人在和人互动时应该具备的。

认识到何时冒险、何时安全行事,对于人工智能来说十分有用,无论是在制造车间、家庭机器人,还是无人驾驶汽车上。

说:“我认为我们还没有学会关于如何处理必须遵循的人类规范的一般原则。但这是一个好的开始,希望它能让我们深入了解这个问题。”

GT Sophy 只是许多击败过人类的人工智能系统中的其中一个,从国际象棋到星际争霸和 DOTA2,人工智能都击败了世界上最好的人类选手。不过 GT 这个游戏给索尼提供了一种新的挑战。

与其他的、特别是那些回合制的游戏不同,GT 要求顶尖玩家在逼近物理极限(超高车速)的情况下实时控制车辆。在竞赛中,所有其他玩家都在做相同的事情。

虚拟赛车以每小时 100 英里的速度疾驰而过,车身与弯道边缘的距离只有几英寸。在这样的速度下,微小的误差都会导致碰撞。

据悉,GT 游戏以详尽地捕捉、并复刻真实世界的物理学而闻名,它模拟了赛车的空气动力学和轮胎在赛道上的摩擦。这一游戏有时甚至被用来训练和招募真实世界的赛车手。

瑞士苏黎世大学机器人和感知小组的负责人(Davide Scaramuzza)说:“它在真实程度方面做得很好。”他并没有参与 GT Sophy 项目,但他的团队曾使用 GT 游戏来训练人工智能驾驶员,目前尚未进行过针对人类的测试。

GT Sophy 参与游戏的方法与人类玩家不同。它不读取屏幕上的像素,而是获取有关自身在赛道上的位置和周围汽车的位置的数据。它还会收到关于影响其车辆的虚拟物理力量的信息。

作为回应,GT Sophy 控制汽车转弯或刹车。这种 GT Sophy 与游戏之间的交互每一秒进行 10 次,及其同事声称,这与人类玩家的反应时间相似。

索尼使用了强化学习,通过试错的方法从零训练 GT Sophy。起初,人工智能只能努力让汽车保持在路上行驶。

但经过在 10 台 PS4 上的训练后(每台运行 20 个程序实例),GT Sophy 在大约 8 小时内提升到了 GT 的内置人工智能水平,相当于业余玩家。在 24 小时内,它就接近了包含 17700 名人类玩家最佳成绩排行榜的最顶端。

GT Sophy 花了 9 天时间不断缩短圈速。最后,它比任何人类玩家都要快。

可以说,索尼的人工智能学会了如何在游戏允许的极限下驾驶,完成了人类玩家力所不能及的动作。令琼斯最为印象深刻的是 GT Sophy 的转弯方式,将刹车提前、以实现用更紧的走线加速出弯。

她说:“GT Sophy 以一种奇怪的方式对待走线,做了一些我甚至从未想过的事情。”例如 GT Sophy 经常把一个轮胎开到赛道边缘的草地上,然后滑进弯道。一般人不会那样做,因为太容易犯错了。这就像是你在控制一起碰撞事故。给我一百次机会,我也许只能成功一次。”

GT Sophy 很快就掌握了这个游戏的物理学,不过更大的问题是裁判。在职业赛场上,GT 比赛由人类裁判监督,他们有权对危险驾驶扣分。

累积惩罚是 GT Sophy 在 2021 年 7 月的第一轮比赛中失利的一个关键原因,尽管它比任何一个人类车手都要快。在几个月后的第二轮比赛中,它学会了如何规避惩罚失分,结果就大不相同了。

在 GT Sophy 上投入了数年的精力。他桌子后面的墙上挂着一幅两辆车争抢位置的画。“这是 GT Sophy 正在超越 Yamanaka,”他说。

他指的是顶尖 GT 日本车手 Tomoaki Yamanaka,他是 2021 年与 GT Sophy 比赛的四名日本职业模拟赛车手之一。

他不记得这幅画是哪一局比赛。如果是 2021 年 10 月的比赛,Yamanaka 很可能会乐在其中,因为他面对的是一个强大但公平的对手。如果这是 2022 年 7 月份的活动,他很可能会咒骂电脑莫名其妙。

Yamanaka 的队友 Takuma Miyazono 通过翻译软件向我们简单描述了 2022 年 7 月份的比赛。他说:“有几次我们被(GT Sophy)撞出赛道,因为它的过弯方式太过激进。这让我们很生气,因为人类玩家会在转弯时减速,以避免开出赛道。”

说,训练人工智能公平竞技且不失去竞争优势是十分困难的。人类裁判会做出取决于环境的主观判罚,这让人们很难将它们转化为人工智能可以学到的东西,比如哪些行为可以做,哪些不可以做。

索尼的研究人员尝试给人工智能提供许多不同的线索,供其调用和调整,希望能找到一种有效的组合。如果它偏离赛道或撞到围栏上,造成了车辆碰撞或可能被裁判判罚,那么它就会受到惩罚。

他们对每种惩罚的力度进行了实验、观察和调试,并且检查了 GT Sophy 的驾驶方式会如何发生变化。

索尼还增加了 GT Sophy 在训练中面临的竞争。在此之前,它主要针对自身的老版本进行训练。

在 2021 年 10 月份的重赛之前,索尼每隔一两周就会邀请顶级 GT 车手帮助测试人工智能,再综合结果不断调整。

“这给了我们所需的反馈,以便在攻击性和让步之间找到合适的平衡,”说。

这起到了效果。三个月后,当 Miyazono 与 GT Sophy 比赛时,后者的激进表现消失了——但它并不是简单地退缩。“当两辆车并排进入一个弯道时,GT Sophy 会给人类车手留下足够通过的空间,”他表示,“这让你感觉是在和另一个真人比赛。”

他补充说:“面对这种反应,车手会得到一种不同的激情和乐趣。这真的给我留下了深刻的印象。”

对索尼的工作印象深刻。他说:“我们用人类的能力来衡量机器人技术的进步。”但是,他的同事埃莉亚·考夫曼(Elia Kaufman)指出,仍然是人类研究人员主导了 GT Sophy 学习行为的训练。

“良好的赛道礼仪是由人类教给人工智能的,”他说,“如果这能以自动化的方式实现,那将真的很有趣。”这样的机器不仅会有良好的赛场风范,更主要的是可以理解什么是赛场风范,并且能够改变它的行为来适应新的设置。

的团队现在正在将其 GT 赛车研究,应用到现实世界的无人机比赛中,使用原始视频输入而不是模拟数据来训练人工智能飞行。2022 年 6 月,他们邀请了两名世界冠军级别的无人机飞手对抗电脑。

他说:“在看到我们的人工智能比赛后,他们的表情说明了一切。他们被震撼到了。”

他认为,对机器人技术的真正进步必须要拓展到现实世界。“在模拟和现实世界之间,总是会有一种不匹配的情况,”他说,“当人们谈论人工智能取得了令人难以置信的进步时,这一点就被遗忘了。在战略方面,是的。但就部署到现实世界而言,我们还差得很远。”

目前,索尼仍坚持将技术仅用在游戏中。它计划将 GT Sophy 用于未来版本的 GT 游戏中。“我们希望这能成为产品的一部分,”美国的执行总监彼得·斯通()说。“索尼是一家娱乐公司,我们希望这能让游戏更加有趣。”

琼斯认为,一旦人们有机会观摩 GT Sophy 的驾驶过程,那么整个模拟赛车社区都可以从中学到很多东西。“在许多赛道上,我们会发现很多沿袭了多年的驾驶技巧都是有缺陷的,实际上存在更快的方法。”

Miyazono 已经在尝试复制人工智能在弯道的走线方式,因为它已经展示了这是可以实现的。琼斯说:“如果基准水平发生变化,那么每个人的技术都会提升。”

以上就是《索尼AI击溃顶级真人赛车手,以1.5秒优势打败人类》的详细内容,更多关于人工智能,艾米丽·琼斯,游戏赛车的资料请关注golang学习网公众号!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
达摩院开源低成本大规模分类框架FFC达摩院开源低成本大规模分类框架FFC
上一篇
达摩院开源低成本大规模分类框架FFC
如何强制立即更新和升级 Windows 11?
下一篇
如何强制立即更新和升级 Windows 11?
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    16次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    13次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    12次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    16次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    17次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码