「机器学习」彻底搞懂CNN

"VALID")

with tf.Session() as sess:

output = sess.run(max_pool, feed_dict={X: dataset})

三、整体CNN框架

典范CNN architecture

有名的CNN架构：

大年夜量应用Inception module，一个输入进来，直接分四步进行处理，这四步处理完后深度直接进行叠加。在不合的标准上对图片进行操作。大年夜量应用1*1的convolution，可以灵活控制输出维度，可以降低参数数量。

LeNet（MISIT上）-1998：输入32*32（在28*28图像上加了zero padding）。第一层kernel用了6个神经元，kernel大年夜小5*5，stride取1，输出就是28*28；第二层做了average pooling，2*2的kernel，stride是2，输出就变为本来的一半，不改变feature map数量；第三层放了16个神经元，其他同理；第五层用了120个神经元，5*5的kernel对5*5的输入做卷积，没法再滑动，输出为1*1；F6用120个1*1的输出全连接84个神经元，Out全连接10个神经元，对应手写体辨认输出的10个数字。

激活函数前面都用的tanh，是传统CNN中常用的，输出层用了RBF比较特别，是一个计算距离的方法去断定和目标输出间距离做lost。。

AlexNet-2012：最早应用于比赛中，近10%的进步了精确度

输入224*224的彩色图像，C1是个很大年夜的11*11的filter，stride=4。。最后连做3层convolution。。最后输出1000个类的分类结不雅。

激活函数应用ReLU，这在现今很风行，输出层用的softmax

AlexNet应用了一个小技能是Local Response Normalization（LRN局部响应归一化）

3、所耗内存计算

这种操作可以在传统输出上加一个bias，推敲到近邻的一些输出影响。即一个输出旁边有很牛掰的输出的话，它的输出就会怂了，收到克制，可以看到，含β的┞符个项都在分母上。但后来发明，这个技巧对分类器的晋升也不是很明显，有的就没有效。

GoogleLeNet-2014：

如右图所示，输入是192，应用了9层inception module，如不雅直接用3*3,5*5参数，可以算一下，之后inception参数数量是异常大年夜的，深度上可声调节，可以指定随便率性数量标feature map，经由过程增长深度把维度减下来。inception模块6个参数刚好对应这6个convolution，膳绫擎4个参数对应膳绫擎4个convolution，参加max pool不会改变feature map数量（如480=128+192+96+64）。

将精确率升高到95-96%，跨越仁攀类分辨率，因为image net中然则狗的种类就有很多，仁攀类无法完全一一分辨出。

ReSNet残差收集-2015：

不再直接进修一个目标函数，输入直接跳过中心层直接连到输出上，要进修的是残差f（x），输入跳过中心层直接加到输出上。

好处是：深度模型路径依附的限制，即gradient向前传导时要经由所有层，如不雅中心有层逝世掉落了，前面的层就无法获灯揭捉?练。残差收集赓续跳跃，即使中心有的层已经逝世掉落，信息仍然可以或许有效流动，使灯揭捉?练旌旗灯号有效往回传导。

3/3 首页上一页 1 2 3

　　推荐阅读

　　我是怎样爬下6万共享单车数据并进行分析的（附代码）

单车的应用频率越高共享的效不雅越好。大年夜摩拜单车的数据看，在流动的单车中，5次以下占据了60%阁下的出行。但1次、2次的也占据了30%阁下的份额，解释摩拜单车的应用率也不是很高。开辟者大年夜赛路>>>详细阅读

本文标题：「机器学习」彻底搞懂CNN

地址：http://www.17bianji.com/lsqh/39483.html

1/2 1