如何用Python和深度神经网络识别图像？

最左边的，是输入层。也就是咱们输入的图片。本例中，是哆啦a梦和瓦力。

在计算机里，图片是按照不合色彩（RGB，即Red, Green, Blue）分层存储的。就像下面这个例子。

根据分辨率不合，电脑会把每一层的图片存成某种大年夜小的矩阵。对应某个行各地位，存的就是个数字罢了。

这就是为什么，在运行代码的时刻，你会发明TuriCreate起首做的，就是从新设置图片的大年夜小。因为如不雅输入图片大年夜小各别的话，下面步调无法进行。

有了输入数据，就次序进入下一层，也就是卷积层（Convolutional Layer）。

应用的时刻，在输入数据上，移动这个小矩阵，跟本来与矩阵重叠的地位上的数字做乘法后加在一路。如许本来的一个矩阵，就变成了“卷积”之后的一个数字。

下面这张动图，很形象地为你说清楚明了这一过程。

这个过程，就是赓续年腋荷琐矩阵上去寻找某种特点。这种特点可能是某个边沿的外形之类。

足够深度，足够复杂吧。

再下一层，叫做“池化层”（Pooling Layer）。这个翻译的确让人无语。我认为翻译成“汇总层”或者“采样层”都要好很多。下文中，我们称其为“采样层”。

采样的目标，是避免让机械认为“必须在左上角的方格地位，有一个尖尖的边沿”。实际上，在一张图片里，我们要识其余对象可能产生位移。是以我们须要用汇总采样的方法模糊某个特点的地位，将其大年夜“某个具体的点”，扩大成“某个区域”。

如不雅如许说，让你认为不敷直不雅，请参考下面这张动图。

这里应用的是“最大年夜值采样”（Max-Pooling）。以本来的2x2范围作为一个分块，大年夜中找到最大年夜值，记录在新的结不雅矩阵里。

一个有效的规律是，跟着层数赓续向右推动，一般结不雅图像（其拭魅正规地说，应当叫做矩阵）会变得越来越小，然则层数会变得越来越多。

只有如许，我们才能把图片中的规律信息采掏出来，并且尽量控制足够多的模式。

如不雅你照样认为不过瘾，请拜访这个网站（https://link.jianshu.com/?t=http%3A%2F%2Fscs.ryerson.ca%2F%7Eaharley%2Fvis%2Fconv%2Fflat.html）。

它为你活泼解析了卷积神经收集中，各个层次上到底产生了什么。

我第一次看见的时刻，震动不已。

请点击这个链接（https://link.jianshu.com/?t=https%3A%2F%2Fgithub.com%2Fwshuyi%2Fdemo-python-image-classification%2Farchive%2Fmaster.zip），下载紧缩包。然后在本地解压。作为咱们的演示目次。

左上角是用户输入地位。请应用鼠标棘手写一个数字（0-9）。写得难看一些也没有关系。

我输入了一个7。

不雅察输出结不雅，模型精确断定第一选择为7，第二可能性为3。答复精确。

我们把鼠标挪到第一个卷积层。停在随便率性一?像素上。电脑就告诉我们这个点是大年夜上一层图形中哪几个像素，经由特点检测（feature detection）得来的。

同理，在第一个Max pooling层上悬停，电脑也可以可视化展示给我们，该像素是大年夜哪几个像素区块里抽样获得的。

这个网站，值得你花时光多玩儿一会儿。它可以赞助你懂得卷积神经收集的内涵。

你可能会认为很高兴。

双击下载后的pkg文件，根据中文提示一步步安装即可。

回想我们的示例图：

下一层叫做全连接层（Fully Connected Layer），它其实就是把上一层输出的若干个矩阵全部紧缩到一维，变成一个长长的输出结不雅。

之后是输出层，对应的结不雅就是我们须要让机械控制的分类。

如不雅只看最后两层，你会很轻易把它跟之前学过的深度神经收集（Deep Neural Network, DNN）接洽起来。

既然我们已经有了深度神经收集，为什么还要如斯辛苦去应用卷积层和采样层，导致模型如斯复杂呢？

这里出于两个推敲：

起首是计算量。图片数据的输入量一般比较大年夜，如不雅我们直接用若干深度神经层将其连接到输出层，则每一层的输入输出数量都很宏大年夜，总计算量是难以想像的。

6/7 首页上一页 4 5 6 7 下一页尾页

　　推荐阅读

　　为初学者准备的MariaDB管理命令

之前我们学过了在 Centos/RHEL 7 上安装 MariaDB 办事器并包管其安然，使之成为了 RHEL/CentOS 7 的默认数据库。如今我们再来看看一些有效的 MariaDB 治理敕令。这些都是应用 MariaDB 最基本的敕令，并>>>详细阅读

本文标题：如何用Python和深度神经网络识别图像？

地址：http://www.17bianji.com/lsqh/40521.html

1/2 1