作家
登录

Github一周热门项目总结:自然语言处理Python库spaCy最热!

作者: 来源: 2017-11-21 10:53:16 阅读 我要评论

【编辑推荐】

  1. 你想找的Python材料这里全都有!没有你找不到!史上最全材料合集
  2. Python开辟中若何应用Hook技能
  3. Python中的优化,大年夜神的法度榜样比我们写的快五倍,本来是如许做的!
  4. Python转JavaScript编译器,天潦攀类!还能转代码,到底怎么做到的
  5. 号称世界最快句法分析器,Python高等天然说话处理库spaCy!
【义务编辑:张燕妮 TEL:(010)68476606】

Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践


以前一周,Github上最热点的项目当属天然说话处理Python库spaCy,该项目比来更新到了2.0版本。SpaCy是一个基于天然说话处理研究创建的开源项目,目标是最终将其用于真实的产品和解决筹划。2.0版本增长了几个新功能,包含新的神经收集模型,支撑更多的说话和改进的文档。

SpaCy的作者Matthew Honnibal在发行解释中写道,新版本经由过程最新的深度进修技巧对spaCy进行了更新,并使得在可扩大的云计算工作流程中运行spaCy变得加倍轻易。

Github一周热点项目总结:天然说话处理Python库spaCy最热!

新版本包含了13种神经收集模型,可用于七种以上说话。它还增长了对八种新说话(英语,德语,西班牙语,葡萄牙语,法语,意大年夜利语,荷兰语和多说话NER)的Alpha标记化支撑。它应用bloom嵌入策略来支撑小表中的大年夜型词汇表。核心神经收集模型具有词性标签,依附标签和定名实体,小型模型将仅具有高低文特定的标记向量,而中等模型将具有词向量。

Git flight rules:应用Git的法度榜样员指南。如不雅工作掉足,开辟人员可以经由过程该项目看看可以做什么。

  • 对于这个版本,大年夜部分应用指南,API文档和代码示例都被重写了。该文档包含有关自定义处理管道,可视化对象,培训教程,单词向量和基于规矩的匹配信息。如今有一个spaCy 101指南,个中包含重要概念的解释和解释以及库的特点总结。

    自年腋荷琐礼拜前更新到2.0版以来,已经宣布了2.0.3版以解决一些bug,甚至经由过程添加视频,更新培训提示和建议等部分来进一步更新文档。

    Github上周其他五大年夜热点项目(根据Trending排行榜得出,感兴趣可直接在Github中搜刮项目名称获取具体信息):

    • State of the art result for machine learning problems:正如名称所述,SoTA可以解决所有机械进修问题。

    • Node best practices:Node.js最佳实践列表

    • JS code to SVG flowchart:用于将JS代码转换成SVG流程图的可视化库。

    • Tensorflow:机械进修开源软件库。



      推荐阅读

      谷歌浏览器大战火狐 你一定猜不到结局

    Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践 对于看热烈不嫌事儿大年夜一>>>详细阅读


    本文标题:Github一周热门项目总结:自然语言处理Python库spaCy最热!

    地址:http://www.17bianji.com/lsqh/39067.html

  • 关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)