基于生物脑机制,利用持续学习培养智能系统的适应能力,清华朱军等研究团队成果登上Nature子刊封面
一分耕耘,一分收获!既然打开了这篇文章《基于生物脑机制,利用持续学习培养智能系统的适应能力,清华朱军等研究团队成果登上Nature子刊封面》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!
在开放、高动态和演化环境中,学习能力是生物智能的核心要素之一,也是人类以及大多数动物在自然选择过程中形成的重要优势。目前,传统机器学习范式是在静态和封闭的数据集上学习到一个模型,并假设其应用环境和之前训练数据的属性相同,因此无法适应动态开放环境带来的挑战
对于这个问题,我们需要持续学习模拟生物智能的学习过程和学习能力,发展新型的机器学习理论和方法,以提升智能体对开放、高动态环境的适应能力。然而,目前主流的机器学习模型通过调整网络参数进行学习,当学习任务的数据分布发生变化时,先前学到的网络参数可能会被覆盖,从而导致对先前知识的灾难性遗忘(catastrophic forgetting)
作为人工智能领域尤其是深度学习发展的一个重要挑战,持续学习近年来受到了广泛的关注。大部分的持续学习方法都致力于提高所学知识的记忆稳定性,以应对灾难性遗忘的问题,例如在学习新任务时固定执行旧任务的网络参数。然而,这些方法通常只能在特定的场景中发挥作用,很难像生物智能那样对现实世界的复杂环境和任务具有普遍适应能力
人工智能领域一直以来都非常关注能否从生物脑的持续学习机理中获得灵感,以开发出新的持续学习方法
对于这个问题,最近,清华大学计算机系朱军教授TSAIL课题组与生命学院钟毅教授课题组合作,在《自然机器智能》期刊上发表了一篇名为《融入神经启发适应性的人工智能方法》的研究论文,该论文被选为12月的封面文章
这项研究采用了贝叶斯方法对生物学习记忆系统的适应性机制进行了深入分析和建模,大大提高了深度神经网络的持续学习能力。这为智能系统在动态开放环境中的自适应发展提供了跨学科的深刻见解
论文链接:https://www.nature.com/articles/s42256-023-00747
引言
随着大规模的标注数据出现和硬件设备计算能力的增强,以深度学习为核心的人工智能在计算机视觉、自然语言处理、自动驾驶、智能机器人等领域取得了一系列突破性进展。然而,深度学习高度依赖于静态的数据分布,难以对动态变化的数据分布进行持续学习
从理论层面来看,持续学习的优化目标可以被进一步细化为记忆稳定性、学习可塑性、泛化兼容性等核心要素。为了适应不断变化的环境和任务,智能系统需要在记忆旧知识和学习新知识之间取得适当的平衡,并具备充分的泛化能力以容纳数据分布之间的差异。
图 1. 持续学习方法示意图,灵感来源于生物智能 (来源:NMI 原文)
作为天然的模板,人类以及大多数动物天生就是以一种持续不断的方式进行学习的。即使是果蝇等简单的生命体,也进化出了多种适应性机制,以实现有效的持续学习。在果蝇的学习记忆系统中,动态变化的感觉信息可以在多个并行的持续学习模块中被有选择地保护和遗忘,为人工智能提供了重要的启示
图2展示了记忆的选择性保护与遗忘机制。这个图表的来源是NMI的原文
研究概览
在方法层面上,研究人员提出了一种生物启发的记忆调控方法,用于有选择地保护和遗忘所学知识。在学习新任务时,该方法通过优化参数分布中的旧任务信息来促进记忆的稳定性,并引入一定程度的遗忘率以促进学习的可塑性。研究人员进一步推导出了一种突触扩张-再归一化的优化算法,使神经网络能够在新旧任务的最优解之间做出明确的权衡,并以此分析了遗忘率在降低持续学习的泛化误差方面的作用,从功能目标和实现机制两个层面与生物智能相呼应
图3展示了一个动态调节的并行多模块结构,该结构是从NMI原文中获取的。
同时,研究人员构建了一种类似于果蝇学习记忆系统的并行多模块结构,对应于多个持续学习专家。通过在每个模块中实施所提出的记忆调控机制,可以有选择性地保护和遗忘记忆,从而使各个模块能够分化出适当的任务专长,充分适应不同任务的数据分布差异。研究人员还深入探讨了神经网络的随机性因素与学习规则和遗忘率的相互作用,证明神经系统的适应性机制并不是孤立运作的,而是高度协同的
图 4. 持续学习基准的多种实验结果 (来源:NMI 原文)
在多种持续学习基准中,包括视觉任务和强化任务等,透过提出的适应性机制,能够显著提高深度神经网络的持续学习能力。此外,论文还从遗忘的生物学意义和实现机制等角度深入探讨了智能系统在持续学习方面的联系,作为一种新的范式,推动人工智能和生物智能的协同发展
图5显示了一篇关于持续学习的全面综述,该综述的来源是团队的arxiv论文https://arxiv.org/abs/2302.00487
作者及课题组介绍
本论文的共同通讯作者是清华大学的朱军教授和钟毅教授。本论文的共同第一作者是水木学者博士后王立元和张幸幸助理研究员。本论文的共同作者包括清华大学的李乾助理研究员、苏航副研究员,以及伦敦大学学院的张鸣天博士
清华大学TSAIL课题组一直致力于贝叶斯机器学习的理论和算法研究。最近几年,课题组在机器学习和神经科学的最新进展基础上,发表了一系列重要的持续学习领域的成果。今年年初,他们完成了一篇名为《持续学习的综合调查:理论、方法和应用》的综述论文,对持续学习的基本设置、理论基础、代表性方法和实际应用等方面的研究进展进行了系统梳理,并提出了未来的发展方向。这篇论文引起了国内外人工智能社区的广泛关注
另外,还提出了一些针对持续学习领域中普遍存在的技术难题的解决方法,包括生成模型的半监督持续学习 (CVPR’21)、具备选择性遗忘的权重正则化方法 (NeurIPS’21)、自适应数据压缩的记忆回放方法 (ICLR’22)、以及动态并行模块的持续学习架构 (ECCV’22)等
最近,NeurIPS’23将有关预训练模型持续学习理论与方法的研究论文“基于提示的持续学习的分层分解:重新思考模糊的次优性”评为重点关注。该论文通过对预训练背景下的持续学习优化目标进行分层分解,提出了适用于各种微调技术(如提示、适配器、LoRA等)的通用框架,显著提升了预训练模型在动态开放环境下的自适应性
文中关于模型,训练的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《基于生物脑机制,利用持续学习培养智能系统的适应能力,清华朱军等研究团队成果登上Nature子刊封面》文章吧,也可关注golang学习网公众号了解相关技术文章。

- 上一篇
- 云端生成式AI:自建或购买,该选哪种方式?

- 下一篇
- 保险主业迎来AI赋能:平安健康险实现深度融合“保险+科技+健康服务”
-
- 科技周边 · 人工智能 | 11分钟前 |
- DeepSeek玩转印象笔记,轻松创建个人AI知识宝库
- 143浏览 收藏
-
- 科技周边 · 人工智能 | 42分钟前 |
- 深度解读!六种高效访问DeepSeek满血版技术方案汇总
- 294浏览 收藏
-
- 科技周边 · 人工智能 | 45分钟前 |
- DeepSeek还能这样玩?手把手教你整合印象笔记,轻松拥有专属AI知识库
- 387浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- DeepSeek来了!PS智能修图,一键优化图片就这么简单
- 256浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 豆包AI玩转影视梗图,3天涨粉5w的神级操作大揭秘
- 364浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 零门槛上手DeepSeek!满血功能配置教学指南
- 189浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- Confluence+DeepSeek:企业级文档管理与 AI 问答集成
- 130浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- AI证件照生成中的肤色调整技巧
- 406浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 文心一言可以分析视频吗 文心一言视频分析功能揭秘
- 146浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 | 大族激光
- 大族激光子公司大族数控递表港交所,2024年海外营收同比增长313.72%
- 352浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 即梦ai积分兑换规则解析 即梦ai积分兑换详细步骤说明
- 148浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 互联网信息服务算法备案系统
- 了解互联网信息服务算法备案系统,掌握如何进行算法备案的详细步骤和要求,确保您的互联网服务合规运营。
- 57次使用
-
- 魔匠AI
- SEO摘要魔匠AI专注于高质量AI学术写作,已稳定运行6年。提供无限改稿、选题优化、大纲生成、多语言支持、真实参考文献、数据图表生成、查重降重等全流程服务,确保论文质量与隐私安全。适用于专科、本科、硕士学生及研究者,满足多语言学术需求。
- 103次使用
-
- PPTFake答辩PPT生成器
- PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
- 134次使用
-
- Lovart
- SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
- 251次使用
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 123次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览