当前位置: 首页 > news >正文

百度抓取网站图片相亲网站建设策划方案

百度抓取网站图片,相亲网站建设策划方案,mvc做的游戏网站代码,wordpress图片代码1️⃣ GRU介绍 前面介绍的LSTM可以有效缓解RNN的梯度消失问题#xff0c;但是其内部结构比较复杂#xff0c;因此衍生出了更加简化的GRU。GRU把输入门和遗忘门整合成一个更新门#xff0c;并且合并了细胞状态和隐藏状态。于2014年被提出 2️⃣ 原理介绍 GRU的结构和最简单…1️⃣ GRU介绍 前面介绍的LSTM可以有效缓解RNN的梯度消失问题但是其内部结构比较复杂因此衍生出了更加简化的GRU。GRU把输入门和遗忘门整合成一个更新门并且合并了细胞状态和隐藏状态。于2014年被提出 2️⃣ 原理介绍 GRU的结构和最简单的RNN是一样的。当前输入为 x t x_t xt​上一个节点传递下来的隐层状态为 h t − 1 h_{t-1} ht−1​这个隐层状态包含了之前节点的相关信息。根据 x t x_t xt​和 h t − 1 h_{t-1} ht−1​GRU会得到当前时间步的输出 y t y_t yt​和传递给下一个节点的隐层状态 h t h_t ht​实际上 y t y_t yt​就是等于 h t h_t ht​ 下面介绍详细的原理下图展示了GRU的详细结构 第一步计算重置门它的参数是 W r W_r Wr​用于控制之前的记忆需要保留多少。该门的输入是前一个隐层状态 h t − 1 h_{t-1} ht−1​以及当前时间步的输入 x t x_t xt​输出为 r t r_t rt​在0到1之间 r t σ ( W r ⋅ [ h t − 1 , x t ] ) r_{t}\sigma\left(W_{r}\cdot[h_{t-1},x_{t}]\right) rt​σ(Wr​⋅[ht−1​,xt​])其中 σ \sigma σ表示sigmoid激活函数 第二步我们来看更新门它的参数为 W z W_z Wz​它将LSTM中的输入门和遗忘门结合决定当前时间步应该保留多少以前的记忆多少新信息应该加入。该门的输入也是前一个隐层状态 h t − 1 h_{t-1} ht−1​以及当前时间步的输入 x t x_t xt​省略了偏置参数 b b b输出为 z t 在 0 到 1 之间 z_t在0到1之间 zt​在0到1之间公式具体表达为 z t σ ( W z ⋅ [ h t − 1 , x t ] ) z_{t}\sigma\left(W_{z}\cdot[h_{t-1},x_{t}]\right) zt​σ(Wz​⋅[ht−1​,xt​])其中 σ \sigma σ表示sigmoid激活函数 第三步计算输入值输入值由前一个隐层状态 h t − 1 h_{t-1} ht−1​当前的 x t x_t xt​以及重置门 r t r_t rt​得到。 r t ∗ h t − 1 r_{t}*h_{t-1} rt​∗ht−1​可以理解为之前的记忆保留多少来学习新的内容 x t x_t xt​ h ~ t \tilde{h}_{t} h~t​相当于利用之前的记忆对新的内容理解的部分 h ~ t tanh ⁡ ( W ⋅ [ r t ∗ h t − 1 , x t ] ) \tilde{h}_{t}\operatorname{tanh}\left(W\cdot[r_{t}*h_{t-1},x_{t}]\right) h~t​tanh(W⋅[rt​∗ht−1​,xt​]) 第四步计算当前输出 h t h_t ht​由两部分一部分是之前信息的影响 h t − 1 h_{t-1} ht−1​后一部分是当前输入的影响 h ~ t \tilde{h}_t h~t​。 z t z_{t} zt​是更新门的输出取值在0-1之间。给 h t − 1 h_{t-1} ht−1​赋予 ( 1 − z t ) (1-z_t) (1−zt​)权重给 h ~ t \tilde{h}_t h~t​赋予 z t z_{t} zt​权重 h t ( 1 − z t ) ∗ h t − 1 z t ∗ h ~ t \begin{aligned}h_t(1-z_t)*h_{t-1}z_t*\tilde{h}_t\end{aligned} ht​(1−zt​)∗ht−1​zt​∗h~t​​ 我前面写的这篇文章中介绍了为什么RNN会有梯度消失和爆炸点这里查看 主要原因是反向传播时梯度中有这一部分 ∏ j k 1 3 ∂ s j ∂ s j − 1 ∏ j k 1 3 t a n h ′ W \prod_{jk1}^3\frac{\partial s_j}{\partial s_{j-1}}\prod_{jk1}^3tanh^{}W jk1∏3​∂sj−1​∂sj​​jk1∏3​tanh′W 那么GRU如何缓解RNN的梯度消失问题呢 在GRU里隐层的输出换了个符号从 s s s变成 h h h了。因此我们来分析一下 ∂ h t ∂ h t − 1 \frac{\partial h_t}{\partial h_{t-1}} ∂ht−1​∂ht​​。 我们可以得到 ∂ h t ∂ h t − 1 ( 1 − z t ) … \frac{\partial h_t}{\partial h_{t-1}}(1-z_t)\ldots ∂ht−1​∂ht​​(1−zt​)… 因此我们可以通过控制更新门的输出 z t z_t zt​来控制梯度以缓解梯度消失问题 3️⃣ 总结 GRU和LSTM对比 GRU通过控制更新门的输出 z t z_t zt​来控制梯度以缓解梯度消失问题 4️⃣ 参考 Pytorch_LSTM与GRU白话机器学习-从RNN、LSTM到GRU
http://www.tj-hxxt.cn/news/138813.html

相关文章:

  • 怎么样在公司配置服务器做网站线上电脑培训班
  • 拼多多网站建设方案珠海网站建设技术支持
  • wordpress赞助优化网站排名怎么样
  • 青岛外贸假发网站建设上海有哪些大型企业
  • 郑州 网站建设有限公司阿里网站
  • 关键词网站排名软件北京php培训网站建设
  • 宁波住房和城乡建设部网站owasp+网站开发
  • 怎么建设网站赚钱手机韩国展厅设计网站
  • 广东网站建站系统哪家好wordpress+取消边栏
  • 自己做的网站怎么发布到百度广州公司建站模板
  • 开发网站的意义微信小程序在哪里?
  • 上海市建设工程交易服务中心网站wordpress管理员登陆不上
  • 乐辰网站建设wordpress手机端兼容
  • 健身网站开发可行性分析网站制作免费软件
  • 商河网站建设公司手机网站制作平台有哪些
  • 开个免费的网站多少钱手机端模板网站
  • 金牛区建设局网站杭州网站建设报价
  • 广州网站建设制作价格天河建网站
  • 网站内容和备案不一样自助网站建设系统
  • wordpress网站首页链接乱码深圳 网站优化公司排名
  • 网站兼容代码西安有什么好玩的好吃的
  • 怎样进行网站推广东莞市网络seo推广怎么样
  • 柳州企业网站建设价格有没有做网站的博士专业
  • 做团餐 承包食堂的企业网站网站的默认首页
  • 建设部高级职称查询官方网站查邮箱注册的网站
  • 做门户网站价格66建筑网
  • 网站 维护 费用工商注册网站官网
  • wordpress网站注册不了和平手机网站建设
  • 怎么样建设网站网站开发工程师的生活形态
  • ftp里找到的index文件查看网站建设中查外链网站