导图社区 具有动态正则化的卷积神经网络
具有动态正则化的卷积神经网络:chap1 问题背景:提出动态正则化是为了应对正则化方法的两个主要缺点:1)正则化强度(或振幅)对于不同的网络架构是不灵活的 2)正则化强度在整个训练过程中是不变的。
习惯就是人们长时间养成的生活方式和行为方式,它决定了我们做事的基本方法,有好的习惯的人做事都会有好的结果,而坏习惯的人往往难以成事,因而,人们常说习惯决定命运。这里总结了7个习惯帮助大家成为高效人士。
认知获取的概念 知道一些概念、过程、信息、现象、方法,知道它们大概可以用来解决什么问题,而这些东西过去你都不知道。 结论:认知获取是学习的开始,而非结束。 比如当朋友给我们介绍一位新朋友时,朋友说,这位朋友性格活泼开朗。
国标重点水污染源运维工作日常事项,整理了仪器设置、运维、维修检查的内容,一起来看吧!
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
(外 Q1 2021) 具有动态正则化的卷积神经网络
chap1 问题背景
提出动态正则化是为了应对正则化方法的两个主要缺点:
1)正则化强度(或振幅)对于不同的网络架构是不灵活的 2)正则化强度在整个训练过程中是不变的
chap2 PROPOSED METHOD
1)在Res结构中引入动态正则化
具有动态正则化的2分支Res块,表示训练损失的向后差
① 动态正则化单元 嵌入到Res块的Res分支中:
,
A是恒定振幅,si是第i次迭代时的动态因子,r是均匀随机噪声
② 正则化幅度与 有关, r∈ [ −R、 R],
, 是Res块的总数
③ 在前向传递中,第(l+1)个Res块的输出可以表示为:
在向后传递中, 与噪声 相关
2)正则化强度的更新
所提出的动态正则化强度的更新解决方案是通过训练损失的动态实现的。特别地,训练损失的动态特性可以建模为连续迭代中训练损失之间的向后差:
表示第i次迭代时的训练损失
为了消除连续小批量输入时的波动,应用高斯滤波器对其平滑:
chap3 实验结果
2分支结构与稠密结构
在稠密链接结构上的实验结果表明:我们的动态正则化是稳定的,并将Top-1误差减少了1.67%
3分支结构
表I和表II的结果表明,在2分支和3分支结构上与当时最新的正则化方法 Shake-Shake,Shake-Drop, DropBlok 的比较,提出的动态正则化可以适应各种网络架构。与基线相比,本文提出的方法可以平均减少2%以上的误差
chap4 消融研究和讨论
1)动态正则化的有效性
2)正则化强度一览表
3)随机噪声
4)高斯滤波器