谈到今后的工作,何世柱博士表示:“ COREQA 模型今朝照样过于依附进修数据。大年夜实验结不雅可以看出,在模仿的人工数据上几乎可以有完美的表示,然则在真实的数据上照样差能人意。究其原因照样该模型本质是对原始数据的拟合,进修一个输入问题(词序列)到输出谜底(词序列)的映射函数,特别长短实体词(即,不是拷贝和检索获得的词)经常猜测得不精确。这是该模型最大年夜的问题,我们筹划参加一些外部的人工常识对模型进行调剂,对现有模型进行改进。另一个不足是今朝只能应用三元组情势表示的常识库,并假设谜底实体就是三元组的 object 部分,其实该假设对很多问题并不成立,另一个可能的改进偏向就是应用不合表示方法的常识库。别的,该模型也可以应用于机械翻译等义务,可以让说话生成模型能外部常识资本进行交互。”
而对于问答体系将来的成长,何世柱博士也有一些本身的的看法:“据我懂得,真实的工程实践上,问答体系照样应用模板和规矩,很少或者根本不会用到统计模型,更别说深度进修的模型了。而今朝在研究界,问答体系几乎全部采取深度进修模型,甚至是完全端到端的办法。究其原因,我小我认为问答体系是一个体系工程,而不是一个纯粹的研究义务,今朝研究界对问答体系还没有一个同一典范式(不像信息检索、机械翻译、信息采取等义务),是以,将来问答体系可能须要总结出一个或几个通用范式和流程,可以分化为若干子义务,如许会更易于推动问答的研究成长。别的,问答体系效不雅无法达到实用,其问题还没有分析清跋扈,是常识资本不完全,照样常识表示的异构性,或者是懂得天然说话问题的挑衅?最后,我认为,问答体系这类须要大年夜量常识的义务,在数据范围难以大年夜范围扩大的情况下,融合统计模型和先验常识(萃取的常识库、说话常识、常识等)是可行的成长偏向。”\
论文作者 | 何世柱、刘操、刘康、赵军(主动化所&中科院大年夜学)
特约记者 | 王哲(中国科学技巧大年夜学)
迎接查看论文原文:
Generating Natural Answers by Incorporating Copying and Retrieving Mechanisms in Sequence-to-Sequence Learning
推荐阅读
最左前缀道理与相干优化 本文以MySQL数据库为研究对象,评论辩论与数据库索引相干的一些话题。特别须要解释的是,MySQL支撑诸多存储引擎,而各类存储引擎对索引的支撑也各不雷同,是以MySQ>>>详细阅读
本文标题:让问答更自然 - 基于拷贝和检索机制的自然答案生成系统研究
地址:http://www.17bianji.com/lsqh/35160.html
1/2 1