就是如许!你应用神经收集创建了一个模型来将文本分类到不合的类别中。恭喜!
(猜测工作流)
你创建的模型的目标是对文本分类,我们定义了:
- input: text, result: category
我们有一个应用已经标记过的文本(每个文本都有了它属于哪个分类的标记)练习的数据集。在机械进修中,这种义务的类型是被称为监督进修。
- “我们知道精确的谜底。该算法迭代的猜测练习数据,并由师长教师改┞俘” — Jason Brownlee
你会把数据分成类,是以它也是一个分类义务。
为了创建这个模型,我们将会用到神经收集。
神经收集
神经收集是一个计算模型(一种描述应用机械说话和数学概念的体系的方法)。这些体系是自立进修和被练习的,而不是明白编程的。
神经收集是也大年夜我们的中枢神经体系受到的启发。他们有与我们神经类似的连接节点。
(一个神经收集)
感知器是第一个神经收集算法。这篇文┞仿 很好地说清楚明了感知器的内部工作道理(“人工神经元内部” 的动画异常棒)。
畏敲?解神经收集的工作道理,我们将会应用 TensorFlow 建立一个神经收集架构。在这个例子中,这个架构被 Aymeric Damien 应用过。
神经收集架构
神经收集有两个隐蔽层(你灯揭捉?择 收集会有若干隐蔽层,这是构造设计的一部分)。每一个隐蔽层的义务是 把输入的器械转换成输出层可以应用的器械。
隐蔽层 1
(输入层和第一个隐蔽层)
输入层的每个节点都对应着数据集中的一个词(之后我们会看到这是怎么运行的)
如 这里 所述,每个节点(神经元)乘以一个权重。每个节点都有一个权重值,在练习阶段,神经收集会调剂这些值以产生精确的输出(过会,我们将会进修更多关于这个的信息)
除了乘以没有输入的权重,收集也会增长一个误差 (在神经收集中误差的角色)。
在你的架构中,将输入乘以权宿疾将值与误差相加,这些数据也要经由过程激活函数传递。这个激活函数定义了每个节点的最终输出。比如说:想象一下,每一个节点是一盏灯,激活函数决定灯是否会亮。
有很多类型的激活函数。你将会应用 Rectified Linear Unit (ReLu)。这个函数是如许定义的:
- f(x) = max(0,x) [输出 x 或者 0(零)中最大年夜的数]
例如:如不雅 x = -1, f(x) = 0(zero); 如不雅 x = 0.7, f(x) = 0.7.
隐蔽层 2
第二个隐蔽层做的美满是第一个隐蔽层做的工作,但如今第二层的输入是第一层的输出。
(第一和第二隐蔽层)
如今终于到了最后一层,输出层。你将会应用>
如今有了这个经由练习的模型。为了测试它,还须要创建图元素。我们将测量模型的精确性,是以须要获取猜测值的索引和精确值的索引(因为我们应用的是独热编码),检查它们是否相等,并计算所有测试数据集的平均值:
是以输出节点的编号是输入的数据集的分类的编号。
输出层的值也要乘以权重,并我们也要加上误差,然则如今激活函数不一样。
你想用分类对每一个文本进行标记,并且这些分类互相自力(一个文本不克不及同时属于两个分类)。推敲到这点,你将应用 Softmax 函数而不是 ReLu 激活函数。这个函数把每一个完全的输出转换成 0 和 1 之间的值,并且确保所有单位的和等于一。如许,输出将告诉我们每个分类中每个文本的概率。
- | 1.2 0.46|
推荐阅读
【引自IamOkay的博客】 iOS在Apple公司的强迫请求下,数据传输必须按照ATS(App Transefer Security)条目。关于AFNetworking框架传输HTTPS数据。一.AllowsArbitraryLoads 白名单机制NSAll>>>详细阅读
本文标题:图解机器学习:神经网络和TensorFlow的文本分类
地址:http://www.17bianji.com/lsqh/34909.html
1/2 1