作家
登录

图解机器学习:神经网络和TensorFlow的文本分类

作者: 来源: 2017-04-24 09:29:37 阅读 我要评论

就是如许!你应用神经收集创建了一个模型来将文本分类到不合的类别中。恭喜!

图解机械进修:神经收集和TensorFlow的文本分类
(猜测工作流)

你创建的模型的目标是对文本分类,我们定义了:

  1. input: text, result: category 

我们有一个应用已经标记过的文本(每个文本都有了它属于哪个分类的标记)练习的数据集。在机械进修中,这种义务的类型是被称为监督进修。

  • “我们知道精确的谜底。该算法迭代的猜测练习数据,并由师长教师改┞俘” —  Jason Brownlee

你会把数据分成类,是以它也是一个分类义务。

为了创建这个模型,我们将会用到神经收集。

神经收集

神经收集是一个计算模型(一种描述应用机械说话和数学概念的体系的方法)。这些体系是自立进修和被练习的,而不是明白编程的。

神经收集是也大年夜我们的中枢神经体系受到的启发。他们有与我们神经类似的连接节点。

图解机械进修:神经收集和TensorFlow的文本分类
(一个神经收集)

感知器是第一个神经收集算法。这篇文┞仿 很好地说清楚明了感知器的内部工作道理(“人工神经元内部” 的动画异常棒)。

畏敲?解神经收集的工作道理,我们将会应用 TensorFlow 建立一个神经收集架构。在这个例子中,这个架构被 Aymeric Damien 应用过。

神经收集架构

神经收集有两个隐蔽层(你灯揭捉?择 收集会有若干隐蔽层,这是构造设计的一部分)。每一个隐蔽层的义务是 把输入的器械转换成输出层可以应用的器械。

隐蔽层 1

图解机械进修:神经收集和TensorFlow的文本分类
(输入层和第一个隐蔽层)

输入层的每个节点都对应着数据集中的一个词(之后我们会看到这是怎么运行的)

如 这里 所述,每个节点(神经元)乘以一个权重。每个节点都有一个权重值,在练习阶段,神经收集会调剂这些值以产生精确的输出(过会,我们将会进修更多关于这个的信息)

除了乘以没有输入的权重,收集也会增长一个误差 (在神经收集中误差的角色)。

在你的架构中,将输入乘以权宿疾将值与误差相加,这些数据也要经由过程激活函数传递。这个激活函数定义了每个节点的最终输出。比如说:想象一下,每一个节点是一盏灯,激活函数决定灯是否会亮。

有很多类型的激活函数。你将会应用 Rectified Linear Unit (ReLu)。这个函数是如许定义的:

  • f(x) = max(0,x) [输出 x 或者 0(零)中最大年夜的数]

例如:如不雅 x = -1, f(x) = 0(zero); 如不雅 x = 0.7, f(x) = 0.7.

隐蔽层 2

第二个隐蔽层做的美满是第一个隐蔽层做的工作,但如今第二层的输入是第一层的输出。

图解机械进修:神经收集和TensorFlow的文本分类
(第一和第二隐蔽层)

如今终于到了最后一层,输出层。你将会应用>

  • +-------------------+-----------+ 
  • |    category       |   value   | 
  • +-------------------|-----------+ 
  • |      sports       |    001    | 
  • |      space        |    010    | 
  • | computer graphics |    100    | 
  • |-------------------|-----------| 
  • 如今有了这个经由练习的模型。为了测试它,还须要创建图元素。我们将测量模型的精确性,是以须要获取猜测值的索引和精确值的索引(因为我们应用的是独热编码),检查它们是否相等,并计算所有测试数据集的平均值:

    是以输出节点的编号是输入的数据集的分类的编号。

    输出层的值也要乘以权重,并我们也要加上误差,然则如今激活函数不一样。

    你想用分类对每一个文本进行标记,并且这些分类互相自力(一个文本不克不及同时属于两个分类)。推敲到这点,你将应用 Softmax 函数而不是 ReLu 激活函数。这个函数把每一个完全的输出转换成 0 和 1 之间的值,并且确保所有单位的和等于一。如许,输出将告诉我们每个分类中每个文本的概率。

    1. | 1.2                    0.46| 

        推荐阅读

        iOS AFNetworking框架HTTPS请求配置

      【引自IamOkay的博客】 iOS在Apple公司的强迫请求下,数据传输必须按照ATS(App Transefer Security)条目。关于AFNetworking框架传输HTTPS数据。一.AllowsArbitraryLoads 白名单机制NSAll>>>详细阅读


      本文标题:图解机器学习:神经网络和TensorFlow的文本分类

      地址:http://www.17bianji.com/lsqh/34909.html

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)