让机械像仁攀类一样拥有智能是研究人员一向以来的斗争目标。因为智能的概念难以确切定义,图灵提出了有名的图灵测试(Turning Test):如不雅一台机械可以或许与仁攀类展开对话而不克不及被辨别出其机械身份,那么称这台机械具有智能。图灵测试一向以来都被作为考验人工智能的象征。问答体系本身就是图灵测试的场景,如不雅我们有了和人一样的智能问答体系,那么就相当于经由过程了图灵测试,是以问答体系的研究始终受到很大年夜的存眷。
为了考验模型的效不雅,论文分别在模仿数据集(由 108 个问答模板规矩构造的问答数据)和真实数据集(大年夜百度知道获取的 239,934 个社区问答数据)长进行了实验,在主动评估和人工评估上均取得了不错的结不雅。
传统常识问答都是针对用户(应用天然说话)提出的问句,供给精确的谜底实体,例如:对于问句“泰戈尔的出身地在哪儿?”,返回“加尔各答”。然则,仅仅供给这种孤零零的谜底实体并不是异常友爱的交互方法,用户更欲望接收到以天然说话句子表示的完全谜底,如“印度诗人泰戈尔出身于加尔各答市”。天然谜底可以广泛应用有社区问答、智能客服等常识办事范畴。常识问答中天然谜底的生成在具有异常明白的实际意义和强烈的应用背景。
▲ 图1:COREQA 框架图
与返回谜底实体比拟,常识问答中返回天然谜底有如下优势:
1. 通俗用户更乐于接收可以或许自成一体的谜底情势,而不是局部的信息片段。
▲ 图2:COREQA 解码示例图
2. 天然谜底可以或许对答复问句的过程供给某种情势的解释,还可以无形中增长用户对体系的接收程度。
3. 天然谜底还可以或许供给与谜底相接洽关系的背景信息(如上述天然谜底中的“印度诗人”)。
4. 完全的天然说话句子可以更好地支撑谜底验证、语音合成等后续义务。
然则让常识问答体系生成天然说话情势的谜底并不是一件轻易的工作。今朝,基于深度进修的说话生成模型大年夜多基于原始数据进修数值计算的模型,如安在天然谜底生成过程中融入符号表示的外部常识库是一个大年夜的挑衅。别的,很多问句的答复须要应用常识库中的多个事实,并且一个天然谜底的不合语义单位(词语、实体)可能须要经由过程不号绫桥路获得, 答复这种须要应用多种模式提取和猜测语义单位的复杂问句,给天然谜底的生成带来了更大年夜的挑衅。
为懂得决这些问题,中科院主动化所的何世柱博士、刘操同窗、刘康师长教师和赵军师长教师在本年的 ACL2017 上揭橥了论文「Generating Natural Answers by Incorporating Copying and Retrieving Mechanisms in Sequence-to-Sequence Learning」,提出了端到端的问答体系 COREQA,它基于编码器-解码器(Encoder-Decoder)的深度进修模型,针对须要多个事实才能答复的复杂问句,惹人了拷贝和检索机制,大年夜不合来源,应用拷贝、检索和猜测等不合词汇获取模式,获得不合类型的词汇,对应复杂问句中谜底词汇的不合部分,大年夜而生成复杂问句的天然谜底。
那么具体是怎么做的呢? 这里以“你知道李连比来自哪里吗?” 这个问题为例来解释:
【编辑推荐】
- 滴滴出行与斯坦福人工智能实验室杀青合作
- 人工智能各国计谋解读
- 还认为本身是环球无双的吗?人工智能将对你say no
- 人工智能凭什么息灭仁攀类
- 当人工智能有了“妄图”,仁攀类该若何应对?
1. 常识检索:起重要先辨认问题中的包含的实体词。这里我们辨认出的实体词是:李连杰。然后根据实体词大年夜常识库(Knowledge Base,KB)中检索出相干的三元组(主题,属性,对象)。针对李连杰这个实体,我们可以检索出(李连杰,性别,男),(李连杰,出身地,北京),(李连杰,国籍,新加坡)等三元组。
2. 编码(Encoder):为了生成谜底,我们须要将问题和检索到的常识编码成向量,以便后续深度生成模型应用。
问题编码:应用了双向 RNN(Bi-RNN),用两种方法来表示问题:一种是将两种偏向 RNN 状况向量拼在一路,获得向量序列 Mq;别的一种方法是把每个偏向 RNN 的最后一个向量拿出来拼在一路,获得向量 q,用来整体表示问题句子。
常识编码:应用了记忆收集(Memory Network),对常识检索阶段获得的常识三元组分别进行编码。针对一个三元组,用三个向量分别表示各部分,再将它们拼接在一路,变成一个向量 fi 来表示这个三元组,用 Mkb 表示所有三元组向量。
3. 解码(Decoder):接下来根据谜调和常识的编码向量来生成天然谜底。天然谜底固然是词序列,然则不合的词可能须要经由过程不号绫桥路获得。例如:对于上述问题的谜底“李连出色身在北京,它如今是一个新加坡公平易近。”,词语“李连杰”须要大年夜源问句中拷贝获得,实体词“北京”,“新加坡”须要大年夜常识库中检索获得,而其他词如“出身”、“在”,“如今”等须要经由过程模型猜测获得。是以,这里在标准的序列到序列(Sequence-to-Sequence)模型基本上,融合了三种词语获得模式(包含拷贝、检索和猜测),用同一的模型对其建模,让各类模式之间互相竞争互相竽暌拱响,最终对复杂问题生成一个最好的天然谜底。
推荐阅读
最左前缀道理与相干优化 本文以MySQL数据库为研究对象,评论辩论与数据库索引相干的一些话题。特别须要解释的是,MySQL支撑诸多存储引擎,而各类存储引擎对索引的支撑也各不雷同,是以MySQ>>>详细阅读
本文标题:让问答更自然 - 基于拷贝和检索机制的自然答案生成系统研究
地址:http://www.17bianji.com/lsqh/35160.html
1/2 1