【编辑推荐】
- 你想找的Python材料这里全都有!没有你找不到!史上最全材料合集
- Python开辟中若何应用Hook技能
- Python中的优化,大年夜神的法度榜样比我们写的快五倍,本来是如许做的!
- Python转JavaScript编译器,天潦攀类!还能转代码,到底怎么做到的
- 号称世界最快句法分析器,Python高等天然说话处理库spaCy!
Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践
以前一周,Github上最热点的项目当属天然说话处理Python库spaCy,该项目比来更新到了2.0版本。SpaCy是一个基于天然说话处理研究创建的开源项目,目标是最终将其用于真实的产品和解决筹划。2.0版本增长了几个新功能,包含新的神经收集模型,支撑更多的说话和改进的文档。
SpaCy的作者Matthew Honnibal在发行解释中写道,新版本经由过程最新的深度进修技巧对spaCy进行了更新,并使得在可扩大的云计算工作流程中运行spaCy变得加倍轻易。
新版本包含了13种神经收集模型,可用于七种以上说话。它还增长了对八种新说话(英语,德语,西班牙语,葡萄牙语,法语,意大年夜利语,荷兰语和多说话NER)的Alpha标记化支撑。它应用bloom嵌入策略来支撑小表中的大年夜型词汇表。核心神经收集模型具有词性标签,依附标签和定名实体,小型模型将仅具有高低文特定的标记向量,而中等模型将具有词向量。
Git flight rules:应用Git的法度榜样员指南。如不雅工作掉足,开辟人员可以经由过程该项目看看可以做什么。
对于这个版本,大年夜部分应用指南,API文档和代码示例都被重写了。该文档包含有关自定义处理管道,可视化对象,培训教程,单词向量和基于规矩的匹配信息。如今有一个spaCy 101指南,个中包含重要概念的解释和解释以及库的特点总结。
自年腋荷琐礼拜前更新到2.0版以来,已经宣布了2.0.3版以解决一些bug,甚至经由过程添加视频,更新培训提示和建议等部分来进一步更新文档。
Github上周其他五大年夜热点项目(根据Trending排行榜得出,感兴趣可直接在Github中搜刮项目名称获取具体信息):
-
State of the art result for machine learning problems:正如名称所述,SoTA可以解决所有机械进修问题。
-
Node best practices:Node.js最佳实践列表
-
JS code to SVG flowchart:用于将JS代码转换成SVG流程图的可视化库。
-
Tensorflow:机械进修开源软件库。
推荐阅读
Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践 对于看热烈不嫌事儿大年夜一>>>详细阅读
本文标题:Github一周热门项目总结:自然语言处理Python库spaCy最热!
地址:http://www.17bianji.com/lsqh/39067.html
1/2 1