hapliniste:我认为真正好的 NLP 要远比我们想的更艰苦,也许比及我们实现了通用人工智能(AGI)才会到来(正如说话来自实际世界,不懂得这个世界肯定行不通)。
Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践
众所周知,天然说话处理(NLP)与计算机视觉(CV)是人工智能的两大年夜热点范畴。近年来,跟着深度进修等技巧的成长,计算机视觉范畴成长很快,越来越多的应用开端落地。与之比拟,NLP 范畴今朝的进展若何?昨天,有人在 Reddit 上发出了疑问:是否我们和 NLP 的冲破之间还有很长一段距离?这个问题激发了人们的热烈评论辩论。
问题
我如今对于天然说话处理(NLP)范畴的进展稍感掉望
在 2014 年-2015 年时代,NLP 上有很多有趣的成长偏向:外部存储器(external memory)、推理、无监督/半监督进修、聊天机械人、问答体系、为图像生成文字描述……然而在今天,个中的很多似乎没有若干进展,而人们研究的热点纷纷转向了 GAN 和强化进修。
你认为是如许吗?谈论 NLP 范畴的冲破是否为时尚早?
答复与评论辩论
Jean-Porte:当缁ゎ优结不雅正稳步增长。一些结不雅令人印象深刻,比如在 SNLI 上表示超进出类的最佳办法,尽管我不认为这是仁攀类的┞锋实程度。无监督进修在 NLP 中获获成功(有两篇介绍无监督机械进修的 ICLR 论文),固然机械进修会议(ICLR)中的 NLP 论文相当少。很多高效办法也已在开辟之中(比如 fasttext)。我认为 2014-2015 时代有很多新的有趣且艰苦的问题已解决,并取得了相当好的结不雅。这一范畴在这些问题方面更加成熟,比拟以往冲破性不大年夜,但肯定有进步。
- https://arxiv.org/pdf/1711.00043.pdf
- https://arxiv.org/pdf/1710.11041.pdf
【编辑推荐】
- NLP与常识图谱的对接
- 简荡竽暌剐趣的NLP教程:手把手教你用 PyTorch 辨别天然说话(附代码)
- 天然说话处理技巧(NLP)在推荐体系中的应用
- NLP入门之语音模型道理
- 最周全的百度NLP天然说话处理技巧解析
adammathias:你是对的,NLP 异常难。不仅仅是义务难(当然如许也要看我们选择的义务),分析和表征结不雅更难。很多图像义务中心层的输出的可视化可以获得任何研究委员会、工程经理甚至是纽约时报读者的肯定,就像承认一些计算机艺术一样。
然则作为两个句子的平均的一个句子呢?或者生成自向量空间的一个点?并且这假设练习数据是英文。结不雅就是一切难上加难。进入门槛越高,即刻的嘉奖越低。是以很多研究者改变了研究范畴,逐渐变的让步。
作为一个具体实例,向世界顶级研究与工程组织的异常有才干、善意且干事高效的同僚解释为什么Блацк Форест或者тхроугх是弗成接收的输出并且是彻底的掉败,是一场艰苦异常的┞方斗。是以,喂恼飘后,这依然存在。并且这是一个很简单的问题,更像是一个数据通道 bug,实际上异常好解决。
hapliniste:没错,我也认为说话处理是一个大年夜难题。假如可以制造一个「hyppocampus」控制收集中的信息路由选择,就能拥有一个开辟强大年夜 NLP 的坚实基本,但今朝看来还远远无法实现。
我今朝对于若何实现「AGI」和 NLP 的不雅点如下:
- 须要一种体系,其拥有两种根本构造:函数和表示(类型)。函数就是模型,表示是函数感化的对象(且只能应用一种表示),然后尽可能分化函数,并在其它函数中复竽暌姑;
- 须要一种体系,以找到函数的能给出基于输入的┞俘确的输出的路由。它须要在初始表示(比如一张图像)之寄┞芬到最好或最短的路由并发送到所请求的表示上(好交抄本描述)。所用的表示或类型必须强迫收集只应用合理的路径;
- 可以应用由「hyppocampus」生成的路径,并将其转换为文本描述。如许就能实现一种强大年夜的 NLP 了。
不过也请别太较真,这些都照样未被证实过的不雅点。
adammathias:至于 2017 年第 4 季度,我们甚至没有测验测验。任何真实义务,比如 Nice truck attack、Pope’s Baby Steps on Gays、Loving PR 或者省略说话中的一半语句 (今天的实例),没有额外语境的赞助无法完成。然则绝大年夜多半基准不包含语境。即使我们有一些超等神经收集,并在练习和测试中输入这般的字符串,我们也无法期望该收集会工作。某种意义上在给定输入的情况下,今天的机械进修的机能已几近最优。
为了兑现承诺,Google Now 及其他类似应用确切应用了语境,并且 Manning 的斯坦福实验室已经存眷首语反复法研究。制造语境数据集也面对挑衅,它们必须足够大年夜,然则迁徙可能不太好。一旦有了如许的数据集,会出现出更多有关天然说话的 AGI 研究。
请留意我谈到了「AGI」,但似乎很多人都把 AGI 当做一种进化过程的结不雅,并且是有生命的。但用我的办法不太可能会实现这种 AGI。它可能更像一个 app 商城,个中仁攀类设计的模型以一种监督方法解决义务(这就是为什愦我会称它为「AGI」,而不是 AGI)。
automated_reckoning:这些是绝佳的实例!如斯轻易地在你心中改变意思异常有趣,这很好地证清楚明了语境的重要性,以及天然说话是多么奥妙。
推荐阅读
大年夜制造业、金融办事到公共部分的行业中的公司信赖云办事供给商及其关键的数据,软件即办事(SaaS)应用法度榜样(如Office 365和Salesforce)的快速增长取决于信赖。然则,SaaS在IT安然专业人员肯定云>>>详细阅读
本文标题:Reddit热门话题:你是否也对NLP的发展状态感到失望?
地址:http://www.17bianji.com/lsqh/38995.html
1/2 1