您所在的位置:首页 - 艺术 - 正文艺术
神经网络也有空间意识!学会在创建地图,登上子刊
柏澄
2024-08-12
【艺术】
711人已围观
摘要机器之心报道机器之心编辑部这是人类首次证明神经网络可以创建自己的地图。想象一下,你身处一个陌生的小镇,即使一开始周围的环境并不熟悉,你也可以四处探索,神经网络也有空间意识!学会在创建地图,登上子刊并最终在大脑中绘制出一张环境地图,里面包含建筑物、街道、标志等相互之间的位置关系。这种在大脑中构建空间地图的能力是人类更高级认知类型的基础:例如,有理论认为,语言是由大脑中类似地图的结构编码的。然而,即使是最先进的人工智能和神经网络,也无法凭空构建这样的地图。计算生物学助理教授、HeritageMedi
机器之心报道
机器之心编辑部
这是人类首次证明神经网络可以创建自己的地图。想象一下,你身处一个陌生的小镇,即使一开始周围的环境并不熟悉,你也可以四处探索,神经网络也有空间意识!学会在创建地图,登上子刊并最终在大脑中绘制出一张环境地图,里面包含建筑物、街道、标志等相互之间的位置关系。这种在大脑中构建空间地图的能力是人类更高级认知类型的基础:例如,有理论认为,语言是由大脑中类似地图的结构编码的。
然而,即使是最先进的人工智能和神经网络,也无法凭空构建这样的地图。
计算生物学助理教授、HeritageMedical研究所研究员MattThomson说:「有一种感觉是,即使是最先进的人工智能模型,也不是真正的智能。它们不能像我们一样解决问题;不能证明未经证实的数学结果,也不能产生新的想法。」
「我们认为,这是因为它们无法在概念空间中导航;解决复杂问题就像在概念空间中移动,就像导航一样。人工智能做的更像是死记硬背——你给它一个输入,它给你一个回应。但它无法综合不同的想法。」
最近,Thomson实验室的一篇新论文发现,神经网络可以使用一种叫做「预测编码」的算法来构建空间地图。该论文于7月18日发表在《自然-机器智能》(NatureMachineIntelligence)杂志上。
论文地址:https://www.nature.com/articles/s42256-024-00863-1代码地址:https://github.com/jgornet/predictive-coding-recovers-maps在研究生JamesGornet的带领下,两人在游戏《我的世界》(Minecraft)中构建了环境,将树木、河流和洞穴等复杂元素融入其中。他们录制了玩家随机穿越该区域的视频,并利用视频训练了一个配备预测编码算法的神经网络。

他们发现,神经网络能够学习Minecraft世界中的物体彼此之间是如何组织的,并且能够「预测」在空间中移动时会遇到的环境。
预测编码算法与Minecraft游戏的结合成功地「教会」了神经网络如何创建空间地图,并随后使用这些空间地图来预测视频的后续帧,结果预测图像与最终图像之间的均方误差仅为0.094%。
更重要的是,研究小组「打开」了神经网络(相当于检查内部结构),发现各种物体的表征是相对于彼此进行空间存储的。换句话说,他们看到了存储在神经网络中的Minecraft环境地图。
神经网络可以导航人类设计者提供给它们的地图,例如使用GPS的自动驾驶汽车,但这是人类首次证明神经网络可以创建自己的地图。这种在空间上存储和组织信息的能力最终将帮助神经网络变得更加「聪明」,使它们能够像人类一样解决真正复杂的问题。
这个项目展示了人工智能真正的空间感知能力,而这在OpenAI的Sora等技术中仍然看不到,后者存在一些奇怪的故障。
JamesGornet是加州理工学院计算与神经系统(CNS)系的学生,该系涵盖神经科学、机器学习、数学、统计学和生物学。
「CNS项目确实为James提供了一个地方,让他从事其他地方不可能完成的独特工作,」Thomson说。「我们正在采用一种生物启发的机器学习方法,让我们能够在人工神经网络中反向设计大脑的特性,我们希望反过来了解大脑。在加州理工学院,我们有一个非常容易接受这类工作的社区。」
执行预测编码的神经网络
受预测编码推理问题中隐式空间表示的启发,研究者开发了一个预测编码智能体的计算实现,并研究了该智能体在探索虚拟环境时学习到的空间表示。
他们首先使用Minecraft中的Malmo环境创建了一个环境。物理环境的尺寸为40×65格单位,囊括了视觉场景的三个方面:一个山洞提供了一个全局视觉地标,一片森林使得视觉场景之间具有相似性,而一条带有桥梁的河流则限制了智能体如何穿越环境(图1a)。
智能体遵循路径,路径由A*搜索确定,以找到随机取样位置之间的最短路径,并接收每条路径上的视觉图像。
为了进行预测编码,作者构建了一个编码器-解码器卷积神经网络,编码器采用ResNet-18架构,解码器采用转置卷积的ResNet-18架构(图1b)。编码器-解码器架构使用U-Net架构将编码的潜在单元传递到解码器中。多头注意力处理编码潜在单元序列,以编码过去的视觉观察历史。多头注意力有h=8个头。对于维度为D=C×H×W的编码潜在单元,在高度H、宽度W和通道C的情况下,单个头部的维度为d=C×H×W/h。
预测编码器通过最小化实际观测值与预测观测值之间的均方误差来近似预测编码。预测编码器在82,630个样本上进行了200个epoch训练,使用了具有Nesterov动量的梯度下降优化,权重衰减为5×10^(-6),学习率为10^(-1),并通过OneCycle学习率调度进行调整。优化后的预测编码器预测图像与实际图像之间的均方误差为0.094,具有良好的视觉保真度(图1c)。
更多细节请参见原论文。
参考链接:
https://techxplore.com/news/2024-07-neural-network-minecraft.html
https://www.tomshardware.com/tech-industry/artificial-intelligence/neural-network-learns-to-make-maps-with-minecraft-code-available-on-github
Tags: 神经网络也有空间意识!学会在创建地图登上子刊
版权声明: 感谢您对【奚诗百科网】网站平台的认可,无特别说明,本站所有文章均归【奚诗百科网】平台所有,转载请说明文章出处“来源【奚诗百科网】”。 https://www.sptgyg.com/post/12670.html
最近发表
- 三星W系列手机,奢华与科技的完美融合
- 探索北京,十大免费景点排名及深度体验指南
- 探索知识宝库,小学四书的奥秘
- 时光的旋律,探索一百首经典老歌曲的魅力
- 艺术设计专业,创意与薪酬的完美融合
- 探索北京,30个免费景点全攻略
- 开启你的学术之旅,研究生择校咨询的艺术与科学
- 探索北京,免费景点的宝藏之旅
- 华为云账号登录官网,一站式指南
- 三星Galaxy S7 Edge,2016年的旗舰手机及其历史价值
- 985工程大学排名名单,中国顶尖学府的荣耀与挑战
- 华为荣耀10青春版,青春的风采,一图尽览
- 考研路上的钱包指南,预算大揭秘
- 华为MatePad Pro,您的智能生活新伙伴
- 时光回响,一千首经典老歌曲大全
- 考研路上的灯塔,揭秘考研辅导机构的神奇力量
- 穿越时空的旋律,一千首经典老歌曲的不朽魅力
- 旋律中的世界,全球著名音乐剧的魅力与影响
- 三星手机图片大全,视觉盛宴,科技与美学的结晶
- 旋律中的世界,探索全球著名音乐剧的魅力
- 三星W系列手机,高端奢华与卓越性能的完美结合
- 函授硕士研究生报考条件,开启你的远程学习之旅
- 英文经典音乐剧,穿越时空的旋律与故事
- 福建省美术学院排名大揭秘,艺术殿堂的十座灯塔
- 探索京城,北京免费景点全攻略
- 四书五经,古典智慧的宝库
- 索尼摄像机使用指南,轻松掌握拍摄技巧
- 考研路上的灯塔,为何选择多样的考研课程至关重要
- 旋律与梦想,探索著名英语音乐剧的魅力与影响
- 电影中的音乐之旅,西方音乐电影的魅力与启示
- 深入了解考研课程班的费用,一个全面的指南
- 探索北京,揭秘免门票的宝藏景区
- 考研课程费用解析,如何判断合适的投资
- 艺术之门,揭秘美术公办二本最低分数线的秘密
- 探索北京,十大必去景点深度游
- 舞动经典,探索歌舞剧电影的魅力
- 戴尔最新款笔记本型号,性能、特点与购买指南
- 深入解析,考研课程费用大揭秘
- 揭秘考研课程费用,如何辨别正规课程,避免经济与时间的双重损失
- 荣耀Magic系统,智能生活的新篇章
- 电影之旅,探索英美经典电影的魅力
- 考研路上的金钥匙,揭秘考研课程的价值与成本
- 探索北京,十大免费景点排名及深度体验指南
- 探索云端世界,华为云账号登录官网的便捷之旅
- 舞动梦想,歌唱生活,美国歌舞剧电影的魅力与影响
- 2023年十大名牌手机,科技与设计的巅峰对决
- 苹果与富士康的舞步,全球供应链中的合作与挑战
- 三星GTS3850,智能生活,触手可及
- 艺术之门,2023年美术学院录取分数线排名解析
- 探索北京,免费景点的宝藏之旅