博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[DeeplearningAI笔记]序列模型1.10-1.12LSTM/BRNN/DeepRNN
阅读量:6240 次
发布时间:2019-06-22

本文共 1179 字,大约阅读时间需要 3 分钟。

5.1循环序列模型

觉得有用的话,欢迎一起讨论相互学习~

1.10长短期记忆网络(Long short term memory)LSTM

Hochreiter S, Schmidhuber J. Long Short-Term Memory[J]. Neural Computation, 1997, 9(8):1735-1780.

门控循环神经网络单元GRU

949241-20180827103252507-1241527978.jpg

长短期记忆网络LSTM

  • 记忆细胞更新:
    \[\breve{C}^{<t>}=tanh(W_c[a^{<t-1>},x^{<t>}]+b_c)\]
  • 更新门:
    \[\gamma_u=\sigma(W_u[a^{<t-1>},x^{<t>}]+b_{u})\]
  • 遗忘门--遗忘门在GRU中相当于\((1-\gamma_u)\),在LSTM中使用专用的\(\gamma_f\)代替:
    \[\gamma_f=\sigma(W_f[a^{<t-1>},x^{<t>}]+b_{f})\]
  • 输出门:
    \[\gamma_o=\sigma(W_o[a^{<t-1>},x^{<t>}]+b_{o})\]
  • 记忆细胞:
    \[c^{<t>}=\gamma_u * \breve{c}^{<t>} + \gamma_f * c^{<t-1>}\]
  • \[a^{<t>}=\gamma_o * tanh(c^{<t>})\]

949241-20180827111630570-1450524408.jpg

949241-20180827163255750-1495542035.jpg


1.11双向神经网络Bidirectional RNN

  • 这个模型可以让你在序列的某处不仅可以获取之前的信息,还可以获取未来的信息
    949241-20180827164116543-546037930.jpg
  • 在这个句子中,根据原始的模型,并不能区别泰迪熊和美国前总统泰迪的区别。必须要使用到Teddy词后的信息才能识别出Teddy的意义。无论这些单元是标准的RNN块还是GRU单元或者是LSTM单元,前向的结构都不能够识别出Teddy的意义。
  • 双向神经网络结构如下图所示:
    949241-20180827171525425-1406146650.jpg
    这样的网络构成了一个无环图,其中信息的流向,如下动图中显示:
    949241-20180827181156174-1865466186.gif

1.12深层循环神经网络Deepl RNNs

949241-20180827192128338-787007933.jpg

  • 通过计算\(a^{[2]<3>}\)的值来了解RNN的计算过程,\(a^{[2]<3>}\)有两个输入,一个是从下面传上来的\(a^{[1]<3>}\),一个是从左边传进来的输入\(a^{[2]<2>}\)
    \[a^{[2]<3>}=g(W_a^{[2]}[a^{[2]<2>},a^{[1]<3>}]+b_a^{[2]})\]
  • 对于普通的神经网络,也许可以经常看见100层神经网络,但是对于RNN来说,有三层就已经有很多参数了,因为有时间的维度,RNN会变得相当大,一般很少会看见RNN堆叠到很深的层次。
  • 但是深层次的预测却经常见到,即第三层的输出会连接上更深的层,但是水平方向上却不相连

转载于:https://www.cnblogs.com/cloud-ken/p/9544501.html

你可能感兴趣的文章
解决Office 2013无法打开文件并提示错误的问题
查看>>
php-fpm的安装和启动
查看>>
HTML5之Canvas标签简要学习
查看>>
基于Netty4的HttpServer和HttpClient的简单实现
查看>>
读写锁
查看>>
Java对象的序列化和反序列化实践
查看>>
利用webmin修改超级管理员root用户登陆密码
查看>>
ENode 2.0 - 整体架构介绍
查看>>
solr长文本搜索问题
查看>>
Redis客户端Jedis(一)
查看>>
iOS学习之应用偏好设置
查看>>
手把手玩转win8开发系列课程(26)
查看>>
森林、树与二叉树相互转换
查看>>
Spark随谈(一)—— 总体架构
查看>>
算法系列15天速成——第十四天 图【上】
查看>>
django 快速实现登录
查看>>
导入数据时遇见ORA-00054
查看>>
模拟终端打印效果特效
查看>>
forfiles命令批量删除N天前文件
查看>>
顺序队列
查看>>