一文读懂监督学习、无监督学习、半监督学习、强化学习这四种深度学习方式

一般说来，练习深度进修收集的方法重要有四种：监督、无监督、半监督和强化进修。在接下来的文┞仿中，计算机视觉战队将逐个解释这些办法背后所蕴含的理论常识。除此之外，计算机视觉战队将分享文献中经常碰着的术语，并供给与数学相干的更多资本。

监督进修（Supervised Learning）

起首，我们要浏览你的┞氛片（数据集），肯定所有有你父母的┞氛片，并对其进行标注，大年夜而开端此过程。然后我们将把整堆照片分成两堆。我们将应用第一堆来练习收集（练习数据），而经由过程第二堆来查看模型在选择我们父母照片操作上的精确程度（验证数据）。

比及数据集预备就鹱?，我们就会将照片供给给模型。在数学上，我们的目标就是在深度收集中找到一个函数，这个函数的输入是一张照片，而当你的父母不在照片中时，其输出为0，不然输出为1。

此步调平日称为分类义务。在这种情况下，我们进行的平日是一个结不雅为yes or no的练习，但事实是，监督进修也可以用于输出一组值，而不仅仅是0或1。例如，我们可以练习一个收集，用它来输出一小我了偿信用卡贷款的概率，那么在这种情况下，输出值就是0到100之间的随便率性值。这些义务我们称之为回归。

步调2：练习

为了持续该过程，模许可经由过程以下规矩（激活函数）对每张照片进行猜测，大年夜而决定是否点亮工作中的特定节点。这个模型每次大年夜左到右在一个层上操作——如今我们将更复杂的收集忽视掉落。当收集为收集中的每个节点计算好这一点后，我们将达到亮起（或未亮起）的最右边的节点（输出节点）。

既然我们已经知道有你父母的┞氛片是哪些图片，那么我们就可以告诉模型它的猜测是对照样错。然后我们会将这些信息反馈（feed back）给收集。

该算法应用的┞封种反馈，就是一个量化“真实谜底与模型猜测有若干误差”的函数的结不雅。这个函数被称为成本函数（cost function），也称为目标函数（objective function），效用函数（utility function）或适应度函数（fitness function）。然后，该函数的结不雅用于修改一个称为反向传播（backpropagation）过程中节点之间的连倔强度和误差，因为信息大年夜结不雅节点“向后”传播。

我们会为每个图片都反复一遍此操作，而在每种情况下，算法都在尽量最小化成本函数。

其实，我们有多种数学技巧可以用来验证这个模型是精确照样缺点的，但我们常用的是一个非经常见的办法，我们称之为梯度降低（gradient descent）。Algobeans上有一个 “门外汉”理论可以很好地解释它是若何工作的。迈克尔•尼尔森（Michael Nielsen）用数学常识完美了这个办法，个中包含微积分和线性代数。

http://neuralnetworksanddeeplearning.com/chap2.html

步调3：验证

一旦我们处理了第一个客栈中的所有照片，我们就应当预备去测试该模型。我们应充分应用好第二堆照片，并应用它们来验证练习有素的模型是否可以精确地遴选出含有你父母在内的┞氛片。

无监督进修中最有前景的最新成长之一是Ian Goodfellow（当时在Yoshua Bengio的实验室工作时提出）的一个设法主意，称为“ 生查对抗收集（generative adversarial networks）”，个中我们将两个神经收集互相接洽：一个收集，我们称之为生成器，负责生成旨在测验测验欺骗另一个收集的数据，而这个收集，我们称为辨别器。这种办法实现了一些令人惊奇的结不雅，例如可以大年夜文本字符串或手绘草图生成如照片版逼真图片的AI技巧。

半监督进修（Semi-supervised Learning）

我们平日会经由过程调剂和模型相干的各类事物（超参数）来反复步调2和3，诸如琅绫擎有若干个节点，有若干层，哪些数学函数用于决定节点是否亮起，如安在反向传播阶段积极有效地练习权值，等等。而你可以经由过程浏览Quora上的相干介绍来懂得这一点，它会给你一个很好的解释。

步调4：应用

最后，一旦你有了一个精确的模型，你就可以将该模型安排到你的应用法度榜样中。你可以将模型定义为API调用，例如ParentsInPicture(photo)，并且你可以大年夜软件中调用该办法，大年夜而导致模型进行推理并给出响应的结不雅。

获得一个标注好的数据集可能会很难（也就是很昂贵），所以你须要确保猜测的价值可以或许证实获得标记数据的成本是值得的，并且我们起重要对模型进行练习。例如，获得可能患有癌症的人的标签X射线是异常昂贵的，然则获得产生少量践言性和少量假阴性的精确模型的值，这种可能性显然是异常高的。

无监督进修（Unsupervised Learning）

无监督进修实用于你具稀有据集但无标签的情况。无监督进修采取输人悸乾尝尝试查找数据中的模式。比如，将其组织成群（聚类）或查找异常值（异常检测）。例如：

•想像一下，如不雅你是一个T恤制造商，拥有一堆人的身材测量值。那么你可能就会想要有一个聚类算法，以便将这些测量组合成一组集群，大年夜而决定你临盆的XS，S，M，L和XL号衬衫该有多大年夜。

你将在文献中浏览到的一些无监督的进修技巧包含：

•自编码（Autoencoding）

http://ufldl.stanford.edu/tutorial/unsupervised/Autoencoders/

•主成分分析（Principal components analysis）

监督进修是应用已知精确谜底的示例来练习收集的。想象一下，我们可以练习一个收集，让其大年夜照片库中（个中包含你父母的┞氛片）辨认出你父母的┞氛片。以下就是我们在这个假设场景中所要采取的步调。

步调1：数据集的创建和分类

https://www.quora.com/What-is-an-intuitive-explanation-for-PCA

•随机丛林（Random forests）

https://en.wikipedia.org/wiki/Random_forest

•K均值聚类（K-means clustering）

1/2 1 2 下一页尾页

【51CTO.com原创稿件】6月12日，青云QingCloud消息刷爆同伙圈。据记者懂得，此次融资金额为10.8亿元人平易近币，是今朝为止中国云枷⒚鹦业财务性融资单笔最高金额。本轮的投资方包含招商证>>>详细阅读

本文标题：一文读懂监督学习、无监督学习、半监督学习、强化学习这四种深度学习方式

地址：http://www.17bianji.com/lsqh/35710.html

1/2 1