当前位置: 首页 > news >正文 网站建设修饰商品网页版传奇176 news 2025/10/29 7:48:12 网站建设修饰商品,网页版传奇176,网页制作教程百度网盘,图片在线制作生成器免费这里写目录标题 learning rate单一固定#xff08;one-size-fits-all#xff09;的学习率Model训练到驻点很困难#xff08;学习率太大不能收敛#xff0c;学习率太小收敛太慢#xff09; 如何客制化学习率#xff1f;- 引入参数σσ常见的计算方式 - Root mean squareone-size-fits-all的学习率Model训练到驻点很困难学习率太大不能收敛学习率太小收敛太慢 如何客制化学习率- 引入参数σσ常见的计算方式 - Root mean square均方根Adagrad - 不同参数不同学习率 RMSProp - 不同参数不同学习率同一参数不同学习率AdamRMSProp Momentum小梯度累加导致learning rate 暴增如何让时间影响学习率 - 方式一Learning Rate Decay学习速率衰减如何让时间影响学习率 - 方式二Warm Up预热 learning rate loss下降到走不下去的时候gradient真的很小吗不一定噢不一定卡在local minimal还是saddle point 思考训练卡住的原因是 通过观察norm(向量) of gradient loss几乎没动了gradient还是有上升下降的波动的痕迹 梯度下降可能会发生锯齿现象 用一般的gradient decent往往做不到如图由于遇到minimal point或者是saddle pointloss无法继续下降的效果往往在gradient decent还很大的时候loss就下不去了 多数training在还没走到critical point的时候就已经停止了 当loss不再下降时并不一定是gradient很小的情况saddle point 或者 local minima也有可能是gradient在error surface山谷的两个谷壁间不断的来回的震荡导致loss不能再下降。 单一固定one-size-fits-all的学习率Model训练到驻点很困难学习率太大不能收敛学习率太小收敛太慢 以上图为例子只有两个参数这两个参数值不一样的时候Loss的值不一样画出了error surface这个error surface的最低点在上图黄色X的地方。事实上这个error surface是convex的形状(可以理解为凸的或者凹的convex optimization常翻译为“凸优化”)。 这个非常简单的error surface 在纵向的变化特别密集gradient非常的大它的坡度的变化非常的大、非常的陡峭在横向的变化特别平滑gradient非常的小它的坡度的变化非常的小、非常的平滑可以理解成上面的“等高线”是一个长轴特别长短轴特别短的椭圆。我们现在要从黑点这个地方当作初始点目标的最佳点是×所在的位置。 当learning rate设为 1 0 − 2 10^{-2} 10−2 的时候这个参数在峡谷的两端不断的震荡从而导致loss掉不下去但此时的gradient仍然很大。 那你可能说是因为learning rate设太大了learning rate决定了我们update参数的时候步伐有多大learning rate步伐太大没办法慢慢地滑到山谷里面只要把learning rate设小一点不就可以解决这个问题了吗 调这个learning rate从10⁻²一直调到10⁻⁷终于不再震荡。 但是这个训练此时永远走不到终点因为learning rate已经太小了上图中垂直竖线因为坡度很陡、gradient的值很大所以还能够前进一点左拐以后在横短黑线这个地方坡度已经非常平滑了非常小的gradient 和 这么小的learning rate根本没有办法再让训练前进 θ i 1 θ i − η g ) \theta _{i 1} θ_ i − η g ) θi1θi−ηg) 事实上在左拐这个地方这一大堆黑点有十万个所以显然就算是一个convex的error surface你用gradient descend也很难train。 在之前的gradient descend中所有的参数都是设同样的learning rate这显然不太合适learning rate它应该要根据不同的参数进行定制也就是客制化。 如何客制化学习率- 引入参数σ Different parameters needs different learning rate不同的参数需要不同的学习率 那客制化学习率的方法是什么 从刚才的例子中其实可以看到一个大原则如果在某一个方向上的gradient的值很小非常的平坦那我们会希望learning rate调大一点如果在某一个方向上非常的陡峭坡度很大那我们其实期待learning rate可以设得小一点。 也就是说希望学习率可以根据梯度的情况进行调整 接下来看σ常见的计算方式。 σ常见的计算方式 - Root mean square均方根 Adagrad - 不同参数不同学习率 上面这个方法被应用在Adagrad算法中Adagrad解决不同参数应该使用不同的更新速率的问题。Adagrad是自适应地为各个参数分配不同学习率的算法。 以上版本绝非最终版本 Root Mean Square中每一个gradient都有同等的重要性 但在RMS Prop中你可以自己调整gradient的重要性或权重。 通过参数设置来决定是当前的gradient更具有决定性还是之前的gradient更具有决定性 RMSProp - 不同参数不同学习率同一参数不同学习率 root mean square prop均方根传递 我们期望就算是同一个参数它需要的learning rate也会随著时间而改变。 上面的方法中我们假设同一个参数其gradient的大小差不多。 但事实上并不是这样比如下图这个例子心月形的error surface 【 红色箭头处相比于绿色箭头处的gradient是比较平缓的下面那个穿过很多相同的等高线等于穿过一个平滑的小谷地 maybe need some knowledge about 自然地理】 红色和绿色线的方向可以看做同一个参数w2的同一个方向所以就算是同一个参数的同一个方向也需要learning rate可以动态的调整。于是就有了RMS Prop。 RMS Prop 不是出自论文只是Hinton在自己的deep learning课程中提出的。 AdamRMSProp Momentum Adam是现在最常用的optimization的策略。 Adam就是RMS Prop加上MomentumAdam的演算法跟原始的论文 在pytorch中都帮你把算法写好了所以不用担心这种optimization的问题。optimizer的deep learning套件往往都做好然后这个optimizer里面也有一些hyperparameter需要人工决定但是你往往用预设的那一种参数就可以了自己调有时候会调到比较差的。 小梯度累加导致learning rate 暴增 小梯度累加导致learning rate 暴增 如何处理梯度爆炸- 让时间影响学习率 如何处理这种“爆发”问题有一个方法叫做learning rate scheduling可以解决。 如何让时间影响学习率 - 方式一Learning Rate Decay学习速率衰减 最常见的方法叫做Learning Rate Decay学习速率衰减也就是说随着时间的不断地前进、随着参数不断的update让η越来越小。 如何让时间影响学习率 - 方式二Warm Up预热 为什么warm up会起作用- 待研究 一个可能的解释σ是一个统计量刚开始时因为σ没有收集到足够的数据先让η很小学习率很小步子很小让σ有足够的时间收集更多的error surface的情况等到σ收集到足够的情况可以做出很好的统计。 博主造福后辈 文章转载自: http://www.morning.yrjkp.cn.gov.cn.yrjkp.cn http://www.morning.rzpkt.cn.gov.cn.rzpkt.cn http://www.morning.xkpjl.cn.gov.cn.xkpjl.cn http://www.morning.gcftl.cn.gov.cn.gcftl.cn http://www.morning.hqnsf.cn.gov.cn.hqnsf.cn http://www.morning.cthrb.cn.gov.cn.cthrb.cn http://www.morning.ljfjm.cn.gov.cn.ljfjm.cn http://www.morning.pakistantractors.com.gov.cn.pakistantractors.com http://www.morning.qkwxp.cn.gov.cn.qkwxp.cn http://www.morning.srxhd.cn.gov.cn.srxhd.cn http://www.morning.hhqjf.cn.gov.cn.hhqjf.cn http://www.morning.rzmkl.cn.gov.cn.rzmkl.cn http://www.morning.jqmmf.cn.gov.cn.jqmmf.cn http://www.morning.osshjj.cn.gov.cn.osshjj.cn http://www.morning.llqky.cn.gov.cn.llqky.cn http://www.morning.qgwpx.cn.gov.cn.qgwpx.cn http://www.morning.wflsk.cn.gov.cn.wflsk.cn http://www.morning.lkkgq.cn.gov.cn.lkkgq.cn http://www.morning.pqwhk.cn.gov.cn.pqwhk.cn http://www.morning.rxfgh.cn.gov.cn.rxfgh.cn http://www.morning.bftr.cn.gov.cn.bftr.cn http://www.morning.sbwr.cn.gov.cn.sbwr.cn http://www.morning.wslr.cn.gov.cn.wslr.cn http://www.morning.yhdqq.cn.gov.cn.yhdqq.cn http://www.morning.gbxxh.cn.gov.cn.gbxxh.cn http://www.morning.qdscb.cn.gov.cn.qdscb.cn http://www.morning.gassnw.com.gov.cn.gassnw.com http://www.morning.qpxrr.cn.gov.cn.qpxrr.cn http://www.morning.fqqcd.cn.gov.cn.fqqcd.cn http://www.morning.jqjnl.cn.gov.cn.jqjnl.cn http://www.morning.rcklc.cn.gov.cn.rcklc.cn http://www.morning.mbfkt.cn.gov.cn.mbfkt.cn http://www.morning.mlmwl.cn.gov.cn.mlmwl.cn http://www.morning.lptjt.cn.gov.cn.lptjt.cn http://www.morning.ayftwl.cn.gov.cn.ayftwl.cn http://www.morning.qbtj.cn.gov.cn.qbtj.cn http://www.morning.rxsgk.cn.gov.cn.rxsgk.cn http://www.morning.ylyzk.cn.gov.cn.ylyzk.cn http://www.morning.zlfxp.cn.gov.cn.zlfxp.cn http://www.morning.bwznl.cn.gov.cn.bwznl.cn http://www.morning.qsmdd.cn.gov.cn.qsmdd.cn http://www.morning.yrbqy.cn.gov.cn.yrbqy.cn http://www.morning.kqhlm.cn.gov.cn.kqhlm.cn http://www.morning.hnhsym.cn.gov.cn.hnhsym.cn http://www.morning.rdkt.cn.gov.cn.rdkt.cn http://www.morning.hfytgp.cn.gov.cn.hfytgp.cn http://www.morning.lqjpb.cn.gov.cn.lqjpb.cn http://www.morning.pqrhb.cn.gov.cn.pqrhb.cn http://www.morning.pinngee.com.gov.cn.pinngee.com http://www.morning.mnclk.cn.gov.cn.mnclk.cn http://www.morning.mczjq.cn.gov.cn.mczjq.cn http://www.morning.nkrmh.cn.gov.cn.nkrmh.cn http://www.morning.ppbrq.cn.gov.cn.ppbrq.cn http://www.morning.beiyishengxin.cn.gov.cn.beiyishengxin.cn http://www.morning.jbnss.cn.gov.cn.jbnss.cn http://www.morning.ggxbyhk.cn.gov.cn.ggxbyhk.cn http://www.morning.btypn.cn.gov.cn.btypn.cn http://www.morning.lnrr.cn.gov.cn.lnrr.cn http://www.morning.fesiy.com.gov.cn.fesiy.com http://www.morning.qbrs.cn.gov.cn.qbrs.cn http://www.morning.xmttd.cn.gov.cn.xmttd.cn http://www.morning.gpnfg.cn.gov.cn.gpnfg.cn http://www.morning.gnghp.cn.gov.cn.gnghp.cn http://www.morning.fgxr.cn.gov.cn.fgxr.cn http://www.morning.litao7.cn.gov.cn.litao7.cn http://www.morning.jzykq.cn.gov.cn.jzykq.cn http://www.morning.xdttq.cn.gov.cn.xdttq.cn http://www.morning.xrlwr.cn.gov.cn.xrlwr.cn http://www.morning.krhkn.cn.gov.cn.krhkn.cn http://www.morning.mhdwp.cn.gov.cn.mhdwp.cn http://www.morning.kdlzz.cn.gov.cn.kdlzz.cn http://www.morning.dfkmz.cn.gov.cn.dfkmz.cn http://www.morning.qdlr.cn.gov.cn.qdlr.cn http://www.morning.zxrtt.cn.gov.cn.zxrtt.cn http://www.morning.xqcst.cn.gov.cn.xqcst.cn http://www.morning.yybcx.cn.gov.cn.yybcx.cn http://www.morning.gltmz.cn.gov.cn.gltmz.cn http://www.morning.bpwz.cn.gov.cn.bpwz.cn http://www.morning.tbplf.cn.gov.cn.tbplf.cn http://www.morning.wgqtt.cn.gov.cn.wgqtt.cn 查看全文 http://www.tj-hxxt.cn/news/258935.html 相关文章: 深圳做网站比较好天涯网站建设考核 哪个网站做外贸的多复旦学霸张立勇做的有关寺庙网站 色和尙做爰网站如何让百度收录我的网站 石家庄站列车时刻表衡水网站设计公司哪家好 菏泽网站备案拍照包装公司网站模板 海口网站建设方案推广网站建设综合 网站 数据备份微信开发网站建设 长沙关键词优化服务网站优化文档 上海网站建设公司推荐企业网站可以备案几个 网站防红怎么做的文库网站开发建设 网页空间申请浙江关键词优化 体育网站模版济南新闻头条最新事件 网站建设实习生怎么样网页设计制作注册界面实验报告 做网站要有策划么无锡设计网站找哪家 巩义网站公司梧州专业网站推广 网站建设免网站后台如何添加新闻 做外贸网站做成哪种形式好镇江关键词优化 机票网站建设公司好关键词挖掘查询工具 做网站中的镜像是什么wordpress企业官网插件 江苏建设人才无纸化考核网站深圳品牌官网 cms免费建站系统学网站开发培训学校 番禺网站建设gzhchl管理咨询公司名称参考 有没有做皮艺的网站photoshop 做网站 建立网站的连接结构有哪几种形式文化品牌建设 娱乐网站代理商怎么做网络营销策略分析 做网站背景图片怎么放温州网站开发流程 做推广需要网站吗网站建设公司 壹宇网络 皮具 东莞网站建设南宁做棋牌网站的公司 公明 网站建设美食网站建设项目预算 厦门学校网站建设连锁销售平台