谷歌推出全新通用AI智能体,改变了3D游戏的玩法
谷歌 DeepMind 突破性地推出了一款名为 SIMA 的通用人工智能智能体,能够理解自然语言指令并执行各种任务,改变了 3D 游戏的格局。与传统的非玩家角色 (NPC) 不同,SIMA 可以作为玩家的伙伴,协助完成任务,例如驾驶、采矿、导航和战斗。该智能体经过多种游戏的训练,包括《模拟山羊 3》、《幸福工厂》和《无人深空》,展示了在不同环境中执行指令的出色能力。
谷歌DeepMind号称打造出了首个能在广泛3D虚拟环境和视频游戏中遵循自然语言指令的通用AI智能体。
名为SIMA,不是NPC,是可以成为玩家拍档,帮忙干活打杂的那种。

比如,在《模拟山羊3》(Goat Simulator 3)中当司机开开车:

在《幸福工厂》(Satisfactory)中挖矿石:

在《瓦尔海姆》(Valheim)中寻找水源:

在《无人深空》中(No Man’s Sky)驾驶宇宙飞船射击小行星收集资源:


……
SIMA全称Scalable Instructable Multiworld Agent,顾名思义可扩展、可指导、多世界。
之前,谷歌DeepMind在AI+游戏方面也做过许多工作,比如推出能和人类玩家打PK、会玩《星际争霸II》的AlphaStar系统。
而SIMA被DeepMind称作是一个“新的里程碑”,主打从适用单一游戏转向通用多种游戏,且可遵循语言指令。

SIMA一公开,网友们也是讨论热烈。
让它们替我完成无聊繁琐的任务,这样我就可以直接做有趣的部分,而不必花几个小时培育chocobos获取随机召唤。

嗯…《最终幻想》(Final Fantasy)玩家无疑了。
专业《模拟山羊》玩家在此刻也懵了:

最近这一连串的AI进展也是整的网友们措不及防,直呼“慢一点”:

10秒内完成的简单任务
接下来再来看一波SIMA的表现。
为了让SIMA接触到更多游戏环境,开发团队表示目前已与八家游戏工作室合作,在九款不同的视频游戏上训练和测试了SIMA。
当前的SIMA已在600个基本技能上进行了评估。
基本操作、交互、使用菜单都会:

简单的任务,10秒内可完成。
除此外,谷歌DeepMind还发布了一份技术报告,一起来看看里面都有啥。
未见过的游戏也会玩
SIMA的整体架构是将预训练视觉模型与自监督学习的Transformer相结合。
从用户那里接收语言指令,并从环境中获取图像观察结果,然后将它们映射为键盘和鼠标动作。
具体架构如下图:

开发人员收集了一个既包括精选研究环境又包括商业视频游戏的大型多样化游戏数据集。
此外,他们还用Unity创建的一个新环境,名为“the Construction Lab”。在这个环境中,智能体需要使用积木构建雕塑,这考验了它们对物体的操纵能力和对物理世界的理解。
数据收集包含多种方法,比如让不同成对的人类玩家的互动,其中一名玩家观察并指导另一名玩家,以此来捕获语言指令;让玩家自由玩游戏,观察他们的操作,并记录下可能导致其游戏行为的指令。

通过在不同的游戏世界中学习,SIMA能够将语言与游戏行为相结合。

不需要访问游戏源代码,也不需要定制API,仅需要两个输入:屏幕上的图像和用户提供的简单的自然语言指令。
然后SIMA就会使用键盘和鼠标输出来控制游戏角色以执行这些指令,这一操作与人类类似,也就意味着SIMA有潜力与任何虚拟环境互动。

在评估测试中,研究人员表示SIMA在九个3D游戏集上接受训练,表现显著优于仅在单个游戏上专门训练的智能体。

而且SIMA在未训练过的游戏中的表现和专门使用该游戏数据集训练过的智能体表现一样好。
也就是说,SIMA在全新环境中具备泛化能力。

此外测试结果还显示,SIMA的性能依赖于语言。在一个控制测试中,智能体没有接受任何语言训练或指令,它就会出现无目的的操作,不遵循指令。
而且,和人类玩家相比较,SIMA水平还是差一点。

更多细节,感兴趣的家人们可以查看技术报告。
理论要掌握,实操不能落!以上关于《谷歌推出全新通用AI智能体,改变了3D游戏的玩法》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
将 Gorm 查询结果映射到结构的列表
- 上一篇
- 将 Gorm 查询结果映射到结构的列表
- 下一篇
- AI Agents开源库全能功能:写小说、当导购、销售都能胜任
-
- 科技周边 · 人工智能 | 34分钟前 |
- 多模态AI提升图像识别速度方法
- 159浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 | Notion数据库 Relation字段 Rollup字段 Lookup字段 InlineRelation视图
- Notion数据库怎么关联?多库关系设置教程
- 301浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 贾跃亭:FF将与特斯拉合作FSD技术
- 409浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 | AdobeFirefly 风格关键词 形状提示 图像补缺 几何形状
- AdobeFirefly形状补缺技巧分享
- 403浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 | AI工具 ai怎么裁剪图片
- XnViewAI裁剪教程详解与技巧
- 281浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 3201次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 3414次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 3444次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 4552次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 3822次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览

