作家
登录

谷歌推自然语言理解框架SLING,理解一步到位

作者: 来源: 2017-11-17 09:12:09 阅读 我要评论

Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践


大年夜多半天然说话懂得(NLU)体系分析说话的过程是一条由分析步调构成的流水线:先标注词性,再进行句法依存分析,然后为输入文本计算出语义表示。

谷歌打破了这条流水线上的所有步调,把它们捏到了一路,推出了一步到位的天然说话懂得体系:SLING。

谷歌推天然说话懂得框架SLING,看文本即知语义|论文+代码

SLING可以或许直接分析天然说话文本,根据它的语义表示生成语义框架图示。与原有的大年夜多半体系比拟,它避免了天然说话懂得流水线的一个严重缺点:前面步调中的缺点会影响后续步调的分析。

实际上,流水线式的天然说话懂得体系有利于对说话懂得的不合阶段进行模块化,然则,早期步调中的缺点会在河畔的步调里产生连锁反竽暌功,对最终的表示产生影响。

比如说,一个典范的流程可能会在早期步调中进行句法依存分析,后来竽暌怪须要共指消解。这种情况下,如不雅依存分析出现缺点,共指消解的结不雅也会受到影响。

而SLING这种直接大年夜文本到语框架图示的办法中,输出的框架图示能直接捕获到用户感兴趣的语义标注,同时避开了流水线式体系所带来的陷阱,还能防止出现不须要的计算。SLING应用一个专用的轮回神经收集(RNN),经由过程框架图示上的增量编辑运算,来为输入文本计算输出表示。

而框架图示则足够灵活,可以或许捕获到很多易激发兴趣的语义义务。

相干资本

SLING分析器的练习只用到了输入词语,不须要依存分析等任何中心注释。

在推理阶段,SLING可以或许快速进行分析,它供给了一个高效、可扩大的图示存储实现,以及一个生成高效代率攀来履行RNN的JIT编译器。固然SLING如今还在实验阶段,但它在通俗台式机CPU上的分析速度已经跨越了2500 token/秒。

框架语义分析

框架语义学将文本(例如一个句子)的意思表示为一组情势语句,每个情势语句成为一个“框架”,可以看作意义或者常识的一个单位,也包含和概念的交互,或者与之相干的其他框架。

SLING将所有语义框架组织成一些列插槽,每个插槽都有本身的名字(角色)和值,这个值可所以文字的,也可所以和另一个插槽之间的连接。

比如嗣魅这句话:

Many people now claim to have predicted Black Monday.

比如说句中的“predict”,就表示为PREDICT-01框架。PREDICT-01和施行predict这个动作的主体有交互(插槽),经由过程ARG0插槽表示,ARG0与表示“people”的PERSON框架相连接;PREDICT-01还和被猜测的客体有交互,表示为ARG1插槽,和表示“Black Monday”的EVENT框架连接。

SLING会大年夜中认出说起的实体(例如人物、地点、事宜)、测量值(例如时光、距离)以及其他概念(例如动词),然后将它们放置在与输入中动词相干的┞俘确语义角色上。

如下图所示:

谷歌推天然说话懂得框架SLING,看文本即知语义|论文+代码

框架语义分析的义务就是直接生成一幅图示,包含像上钤记样经由过程插槽互相连接的框架。

膳绫擎只是一个简单的例子,框架图示很强大年夜,实用于各类复杂的语义标注义务。对于初学者来说,框架是一种将说话内部和外部信息结合起来的方法。然后,这就可以用来处理复杂的说话懂得问题,比如指代、隐喻、借代等。这些义务的语义框架图示只在用到的框架类型、角色、连接限制上有所不合。

SLING

SLING经由过程为易激发兴趣的语义框架进行优化,练习了一个RNN。收集隐蔽层中已经进修到的表示代替了流水线体系中手工调剂的特点组合和中心表示。

在内部,SLING应用编码器-解码器架构,个中应用诸如原始悼?船厥后缀,标点符号等简单词汇特点将每个输入词编码成向量。而解码器用这种表示和本身汗青中的轮回特点,来计算更新框架图示以获得输入句子的预期框架语义表示所需的转换序列。

在练习模型时,SLING应用了TensorFlow和DRAGNN。

下面的动画展示了若何用一次转换将框架和角色增量添加到框架图中。

正如前面用简单例句所解释的那样,SLING应用ARG1这一角色来连接VERB和EVENT框架,EVOKE转换大年夜文本中接下来的几个token中唤起指定类型的框架。同样,CONNECT转换将两个现有框架和一个特定角色连接起来。当输入耗尽,最后一个转换(STOP)履行完成,框架图示被视为已完成,并返回给用户,用户可以查看图示,获得句子背后的语义。

这个转换体系中有一个关键方面,就是会出现一个固定大年夜小的框架留意力缓冲区,代表比来被唤醒或修悛改的框架,如上图的橙色框所示。这个缓冲区捕获了我们偏向于想起比来唤醒、说起、加强过的常识。如不雅框架不再应用,跟着新框架的进入,它最终会被刷新出缓冲区。这个简单的机制在捕获大年夜部分框架间连接上都异常有效。

SLING是用C++写成的,开源代码地址:

https://github.com/google/sling

相干论文SLING: A framework for frame semantic parsing

地址:https://arxiv.org/abs/1710.07032

谷歌推天然说话懂得框架SLING,看文本即知语义|论文+代码


— 完 —

【编辑推荐】

  1. 法度榜样员优良代码注释的5个技能,谷歌开创人的一段代码相当霸气!
  2. Kotlin和Java法度榜样员福利:轻量级Web框架Javalin

      推荐阅读

      做前端好还是Java好?看这三方面

    Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践 这几年来伴跟着互联网的敏捷成长,新兴互联网家当的鼓起,传统行业也逐渐开端互联网化,使得互联网职业袈>>>详细阅读


    本文标题:谷歌推自然语言理解框架SLING,理解一步到位

    地址:http://www.17bianji.com/lsqh/38961.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)