当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 深入了解RNN、LSTM和GRU的介绍、差异和优劣

深入了解RNN、LSTM和GRU的介绍、差异和优劣

来源:网易伏羲 2024-01-25 15:15:13 0浏览 收藏

本篇文章主要是结合我之前面试的各种经历和实战开发中遇到的问题解决经验整理的,希望这篇《深入了解RNN、LSTM和GRU的介绍、差异和优劣》对你有很大帮助!欢迎收藏,分享给更多的需要的朋友学习~

一文了解RNN、LSTM和GRU的概念、异同和优缺点

在时间序列数据中,观察之间存在依赖关系,因此它们不是相互独立的。然而,传统的神经网络将每个观察看作是独立的,这限制了模型对时间序列数据的建模能力。为了解决这个问题,循环神经网络(RNN)被引入,它引入了记忆的概念,通过在网络中建立数据点之间的依赖关系来捕捉时间序列数据的动态特性。通过循环连接,RNN可以将之前的信息传递到当前观察中,从而更好地预测未来的值。这使得RNN成为处理时间序列数据任务的强大工具。

但是RNN是如何实现这种记忆的呢?

RNN通过神经网络中的反馈回路实现记忆,这是RNN与传统神经网络的主要区别。反馈回路允许信息在层内传递,而前馈神经网络的信息仅在层之间传递。因此,有了不同类型的RNN:

  • 循环神经网络(RNN)
  • 长短期记忆网络(LSTM)
  • 门控循环单元网络(GRU)

本文将介绍RNN、LSTM和GRU的概念和异同点,以及它们的一些优点和缺点。

循环神经网络(RNN)

通过反馈回路,一个RNN单元的输出也被同一单元用作输入。因此,每个RNN都有两个输入:过去和现在。使用过去的信息会产生短期记忆。

为了更好地理解,可以展开RNN单元的反馈循环。展开单元格的长度等于输入序列的时间步数。

可以看到过去的观察结果是如何作为隐藏状态通过展开的网络传递的。在每个单元格中,当前时间步的输入、前一时间步的隐藏状态和偏置组合,然后通过激活函数限制以确定当前时间的隐藏状态步。

RNN可用于一对一、一对多、多对一和多对多预测。

RNN的优点

由于其短期记忆,RNN可以处理顺序数据并识别历史数据中的模式。此外,RNN能够处理不同长度的输入。

RNN的缺点

RNN存在梯度下降消失的问题。在这种情况下,用于在反向传播期间更新权重的梯度变得非常小。将权重与接近于零的梯度相乘会阻止网络学习新的权重。停止学习会导致RNN忘记在较长序列中看到的内容。梯度下降消失的问题随着网络层数的增加而增加。

由于RNN仅保留最近的信息,所以该模型在考虑过去的观察时会出现问题。因此,RNN只有短期记忆而没有长期记忆。

此外,由于RNN使用反向传播及时更新权重,网络也会遭受梯度爆炸的影响,如果使用ReLu激活函数,则会受到死亡ReLu单元的影响。前者可能会导致收敛问题,而后者会导致停止学习。

长短期记忆(LSTM)

LSTM是一种特殊类型的RNN,它解决了RNN会梯度消失的问题。

LSTM的关键是单元状态,它从单元的输入传递到输出。单元状态允许信息沿着整个链流动,仅通过三个门进行较小的线性动作。因此,单元状态代表LSTM的长期记忆。这三个门分别称为遗忘门、输入门和输出门。这些门用作过滤器并控制信息流并确定保留或忽略哪些信息。

遗忘门决定了应该保留多少长期记忆。为此,使用了一个sigmoid函数来说明单元状态的重要性。输出在0和1之间变化,0即不保留任何信息;1则保留单元状态的所有信息。

输入门决定将哪些信息添加到单元状态,从而添加到长期记忆中。

输出门决定单元状态的哪些部分构建输出。因此,输出门负责短期记忆。

总的来说,状态通过遗忘门和输入门更新。

LSTM的优点

LSTM的优点类似于RNN,主要优点是它们可以捕获序列的长期和短期模式。因此,它们是最常用的RNN。

LSTM的缺点

由于结构更复杂,LSTM的计算成本更高,从而导致训练时间更长。

由于LSTM还使用时间反向传播算法来更新权重,因此LSTM存在反向传播的缺点,如死亡ReLu单元、梯度爆炸等。

门控循环单元(GRU)

与LSTM类似,GRU解决了简单RNN的梯度消失问题。然而,与LSTM的不同之处在于GRU使用较少的门并且没有单独的内部存储器,即单元状态。因此,GRU完全依赖隐藏状态作为记忆,从而导致更简单的架构。

重置门负责短期记忆,因为它决定保留和忽略多少过去的信息。

更新门负责长期记忆,可与LSTM的遗忘门相媲美。

当前时间步的隐藏状态是基于两个步骤确定的:

首先,确定候选隐藏状态。候选状态是当前输入和前一时间步的隐藏状态以及激活函数的组合。前一个隐藏状态对候选隐藏状态的影响由重置门控制。

第二步,将候选隐藏状态与上一时间步的隐藏状态相结合,生成当前隐藏状态。先前的隐藏状态和候选隐藏状态如何组合由更新门决定。

如果更新门给出的值为0,则完全忽略先前的隐藏状态,当前隐藏状态等于候选隐藏状态。如果更新门给出的值为1,则相反。

GRU的优势

由于与LSTM相比有着更简单的架构,GRU的计算效率更高,训练速度更快,只需要更少的内存。

此外,GRU已被证明对于较小的序列更有效。

GRU的缺点

由于GRU没有单独的隐藏状态和细胞状态,因此它们可能无法像LSTM那样考虑过去的观察结果。

与RNN和LSTM类似,GRU也可能遭受反向传播及时更新权重的缺点,即死亡ReLu单元、梯度爆炸。

今天关于《深入了解RNN、LSTM和GRU的介绍、差异和优劣》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

版本声明
本文转载于:网易伏羲 如有侵犯,请联系study_golang@163.com删除
机器学习中的特征缩放(特征缩放的目的和意义)机器学习中的特征缩放(特征缩放的目的和意义)
上一篇
机器学习中的特征缩放(特征缩放的目的和意义)
wifi查找MAC地址?
下一篇
wifi查找MAC地址?
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 毕业宝AIGC检测:AI生成内容检测工具,助力学术诚信
    毕业宝AIGC检测
    毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
    18次使用
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    29次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    27次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    29次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    31次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码