作家
登录

28款GitHub最流行的开源机器学习项目:TensorFlow排榜首

作者: 来源: 2017-04-19 14:45:51 阅读 我要评论

其他:

  • 开辟说话:Objective-C
  • 许可协定:BSD license
  • GitHub项目地址: https://github.com/nikolaypavlov/MLPNeuralNet

ML_for_Hackers 是针对黑客机械进修的代码库,该库包含了所有针对黑客的机械进修的代码示例(2012)。该代码可能和文中出现的并不完全雷同,因为矜持版以来,可能又添加了附加的注释和修改部分。

24. Apache Mahout

Mahout 是Apache Software Foundation(ASF) 旗下的一个开源项目,供给一些可扩大的机械进修范畴经典算法的实现,旨在赞助开辟人员加倍便利快捷地创建智能应用法度榜样。Mahout包含很多实现,包含聚类、分类、推荐过滤、频繁子项发掘。此外,经由过程应用 Apache Hadoop 库,Mahout 可以有效地扩大到云中。Apache Mahout项目标目标是建立一个可以或许快速创建可扩大、高机能机械进修应用的情况。

固然在开源范畴中相对较为年青,但 Mahout 已经供给了大年夜量功能,特别是在集群和 CF 方面。Mahout 的重要特点包含:

  • Taste CF,Taste是Sean Owen在SourceForge上提议的一个针对CF的开源项目,并在2008年被赠予Mahout;
  • 一些支撑 Map-Reduce 的集群实现包含 k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift;
  • Distributed Naive Bayes 和 Complementary Naive Bayes 分类实现;
  • 针对进化编程的分布式实用性功能;
  • Matrix 和矢量库。

XGBoot至少比现有的梯度上升实现有至少10倍的晋升,同时还供给了多种目标函数,包含回归、分类和排序。因为它在猜测机能上的强大年夜,XGBoot成为很多比赛的幻想选择,其还具有做交叉验证和发明关键变量的额外功能。

应用 Mahout 还可实现内容分类。Mahout 今朝支撑两种根据贝氏统计来实现内容分类的办法:第一种办法是应用简单的支撑 Map-Reduce 的 Naive Bayes 分类器;第二种办法是 Complementary Naive Bayes,它会测验测验改┞俘Naive Bayes办法中的一些问题,同时仍然可以或许维削发单性和速度。

  • 开辟说话:Java
  • 许可协定:Apache
  • GitHub项目地址: https://github.com/apache/mahout

25. Seldon Server

为了实现这一目标,HLearn采取了与标准进修库完全不合的接口。在HLearn中H代表着三个不合的概念,这三个概念也是HLearn设计的根本请求:

  • H代表Haskell。机械进修是大年夜数据中猜测函数,所以功能性编程说话适应机械进修是完全说的通的。但功能性编程说话并没广泛应用于机械进修,这是因为它们固来缺乏支撑进修算法的快速数值计算才能。HLearn经由过程采取Haskell中的SubHask库获得了快速数值计算才能;
  • H同时代表着Homomorphisms。Homomorphisms是抽象代数的根本概念,HLearn将该代数构造用于进修体系中;
  • H还代表着History monad。在开辟新的进修算法过程中,最为艰苦的义务之一就是调试优化过程。在此之前,是没有办法减轻调试过程的工作量的,但History monad正在试图解决该问题。它可以让你在全部线程优化代码的过程中无需修改原代码。此外,应用该技巧时没有增长其他的运行开销。

Seldon是一个开放式的猜测平台,供给内容建议和一般的功能性猜测。它在Kubernetes集群内运行,是以可声调配到Kubernetes范围内的任一地址:内部安排或云安排(例如,AWS、谷歌云平台、Azure)。别的,它还可以衡量大年夜型企业安装的需求。

  • 开辟说话:Java
  • GitHub项目地址: https://github.com/SeldonIO/seldon-server

26. Datumbox - Framework

Datumbox机械进修框架是用Java编写的一个开源框架,该框架的涵盖大年夜量的机械进修算法和统计办法,并可以或许处理大年夜尺寸的数据集。

Datumbox API供给了海量的分类器和天然说话处理办事,可以或许被应用在很多范畴的应用,包含了情感分析、话题分类、说话检测、主不雅分析、垃圾邮件检测、浏览评估、关键词和文本提取等等。今朝,Datumbox所有的机械进修办事都可以或许经由过程API获取,该框架可以或许让用户敏捷地开辟本身的智能应用。今朝,基于GPL3.0的Datumbox机械进修框架已经开源并且可以大年夜GitHub长进行下载。

Datumbox的机械进修平台很大年夜程度上已经可以或许代替通俗的智能应用。它具有如下几个明显的长处:

  • 强大年夜并且开源。Datumbox API应用了强大年夜的开源机械进修框架Datumbox,应用其高度精确的算法可以或许敏捷地构建立异的应用;
  • 易于应用。平台API十分易于应用,它应用了REST&JSON的技巧,对于所有的分类器;
  • 敏捷应用。Datumbox去掉落了那些很花时光的复杂机械进修练习模型。用户可以或许经由过程平台直接应用分类器。

Datumbox重要可以应用在四个方面:一个是社交媒体的监督,评估用户不雅点可以或许经由过程机械进修解决,Datumbox可以或许赞助用户构建本身的社交媒体监督对象;第二是搜刮引擎优化,个中异常有效的办法就是文档中重要术语的定位和优化;第三点是质量评估,在在线通信中,评估用户产生内容的质量对于去除垃圾邮件是异常重要的,Datumbox可以或许主动的评分并且审核这些内容;最后是文本分析,天然说话处理和文本分析对象推动了网上大年夜量应用的产生,平台API可以或许很轻松地赞助用户进行这些分析。

  • 开辟说话:Java
  • 许可协定:Apache License 2.0
  • GitHub项目地址: https://github.com/datumbox/datumbox-framework

27. Jubatus

Jubatus库是一个运行在分布式情况中的在线机械进修框架,即面向大年夜数据数据流的开源框架。它和Storm有些类似,但可以或许供给更多的功能,重要功能如下:

  • 在线机械进修库:包含分类、聚合和推荐;
  • Fv_converter: 数据预处理(用天然说话);
  • 在线机械进修框架,支撑容错。

      推荐阅读

      JS断点调试心得

    1.断点调试是啥?难不难?断点调试其实并不是多么复杂的一件事,简单的懂得无外呼就是打开浏览器,打开sources找到js文件,在行号上点一下罢了。操作起来似乎很简单,其实很多人纠结的是,是>>>详细阅读


    本文标题:28款GitHub最流行的开源机器学习项目:TensorFlow排榜首

    地址:http://www.17bianji.com/lsqh/34852.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)