神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊
从现在开始,努力学习吧!本文《神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊》主要讲解了等等相关知识点,我会在golang学习网中持续更新相关的系列文章,欢迎大家关注并积极留言建议。下面就先一起来看一下本篇正文内容吧,希望能帮到你!
这是人类首次证明神经网络可以创建自己的地图。想象一下,你身处一个陌生的小镇,即使一开始周围的环境并不熟悉,你也可以四处探索,并最终在大脑中绘制出一张环境地图,里面包含建筑物、街道、标志等相互之间的位置关系。这种在大脑中构建空间地图的能力是人类更高级认知类型的基础:例如,有理论认为,语言是由大脑中类似地图的结构编码的。然而, 即使是最先进的人工智能和神经网络,也无法凭空构建这样的地图。 计算生物学助理教授、Heritage Medical 研究所研究员 Matt Thomson 说:「有一种感觉是,即使是最先进的人工智能模型,也不是真正的智能。它们不能像我们一样解决问题;不能证明未经证实的数学结果,也不能产生新的想法。」「我们认为,这是因为它们无法在概念空间中导航;解决复杂问题就像在概念空间中移动,就像导航一样。人工智能做的更像是死记硬背 —— 你给它一个输入,它给你一个回应。但它无法综合不同的想法。」 最近,Thomson 实验室的一篇新论文发现,神经网络可以使用一种叫做「预测编码」的算法来构建空间地图 。该论文于 7 月 18 日发表在《自然 - 机器智能》(Nature Machine Intelligence)杂志上。
- 代码地址:https://github.com/jgornet/predictive-coding-recovers-maps
研究生 James Gornet 带领团队在《我的世界》(Minecraft)中构建了环境,融入复杂元素(如树木、河流、洞穴)。他们录制了玩家随机穿越该区域的视频,并利用视频训练了一个配备预测编码算法的神经网络。
研究发现,神经网络学习了 Minecraft 世界中物体的组织方式,并能「预测」玩家在空间中移动时会遇到的环境。
更重要的是,研究小组「打开」了神经网络(相当于检查内部结构),发现各种物体的表征是相对于彼此进行空间存储的。换句话说,他们看到了存储在神经网络中的 Minecraft 环境地图。
神经网络可以导航人类设计者提供给它们的地图,例如使用 GPS 的自动驾驶汽车,但这是人类首次证明神经网络可以创建自己的地图。这种在空间上存储和组织信息的能力最终将帮助神经网络变得更加「聪明」,使它们能够像人类一样解决真正复杂的问题。
这个项目展示了人工智能真正的空间感知能力,而这在 OpenAI 的 Sora 等技术中仍然看不到,后者存在一些奇怪的故障。
James Gornet 是加州理工学院计算与神经系统(CNS)系的学生,该系涵盖神经科学、机器学习、数学、统计学和生物学。
「CNS 项目确实为 James 提供了一个地方,让他从事其他地方不可能完成的独特工作,」Thomson 说。「我们正在采用一种生物启发的机器学习方法,让我们能够在人工神经网络中反向设计大脑的特性,我们希望反过来了解大脑。在加州理工学院,我们有一个非常容易接受这类工作的社区。」
执行预测编码的神经网络
受预测编码推理问题中隐式空间表示的启发,研究者开发了一个预测编码智能体的计算实现,并研究了该智能体在探索虚拟环境时学习到的空间表示。
他们首先使用 Minecraft 中的 Malmo 环境创建了一个环境。物理环境的尺寸为 40 × 65 格单位,囊括了视觉场景的三个方面:一个山洞提供了一个全局视觉地标,一片森林使得视觉场景之间具有相似性,而一条带有桥梁的河流则限制了智能体如何穿越环境(图 1a)。
- 为了进行预测编码,作者构建了一个编码器 - 解码器卷积神经网络,编码器采用 ResNet-18 架构,解码器采用转置卷积的 ResNet-18 架构(图 1b)。编码器 - 解码器架构使用 U-Net 架构将编码的潜在单元传递到解码器中。
- 多头注意力处理编码潜在单元序列,以编码过去的视觉观察历史。多头注意力有 h = 8 个头。对于维度为 D = C × H × W 的编码潜在单元,在高度 H、宽度 W 和通道 C 的情况下,单个头部的维度为 d = C × H × W/h。
预测编码器采用均方误差最小化策略,拟合预测观测值与真实观测值之间的差异。
训练详情:
- 样本数量:82,630
- 轮次:200
- 优化器:Nesterov 动量梯度下降
- 权重衰减:5 × 10^(-6)
- 初始学习率:10^(-1)
- 学习率调度:OneCycle
训练后,预测编码器达到良好的视觉保真度,预测图像与真实图像之间的均方误差为 0.094(如图 1c 所示)。
参考链接:
https://techxplore.com/news/2024-07-neural-network-minecraft.html
https://www.tomshardware.com/tech-industry/artificial-intelligence/neural-network-learns-to-make-maps-with-minecraft-code-available-on-github
理论要掌握,实操不能落!以上关于《神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

- 上一篇
- 首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了

- 下一篇
- 无限生成视频,还能规划决策,扩散强制整合下一token预测与全序列扩散
-
- 科技周边 · 人工智能 | 4小时前 |
- 苹果必看!DeepSeek模型超详细操作教程
- 232浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 不同国家证件照AI生成,超详细参数设置全攻略
- 104浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- DeepSeek+Pr傻瓜式AI剪辑教程,小白轻松学视频剪辑!
- 336浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 传尊界新車發佈!神秘車型疑似命名S600曝光
- 289浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 零门槛上手DeepSeek,满血功能轻松配置教程
- 204浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 94次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 100次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 105次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 99次使用
-
- Suno苏诺中文版
- 探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
- 98次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览