其他:
- 开辟说话:Objective-C
- 许可协定:BSD license
- GitHub项目地址: https://github.com/nikolaypavlov/MLPNeuralNet
ML_for_Hackers 是针对黑客机械进修的代码库,该库包含了所有针对黑客的机械进修的代码示例(2012)。该代码可能和文中出现的并不完全雷同,因为矜持版以来,可能又添加了附加的注释和修改部分。
24. Apache Mahout
Mahout 是Apache Software Foundation(ASF) 旗下的一个开源项目,供给一些可扩大的机械进修范畴经典算法的实现,旨在赞助开辟人员加倍便利快捷地创建智能应用法度榜样。Mahout包含很多实现,包含聚类、分类、推荐过滤、频繁子项发掘。此外,经由过程应用 Apache Hadoop 库,Mahout 可以有效地扩大到云中。Apache Mahout项目标目标是建立一个可以或许快速创建可扩大、高机能机械进修应用的情况。
固然在开源范畴中相对较为年青,但 Mahout 已经供给了大年夜量功能,特别是在集群和 CF 方面。Mahout 的重要特点包含:
- Taste CF,Taste是Sean Owen在SourceForge上提议的一个针对CF的开源项目,并在2008年被赠予Mahout;
- 一些支撑 Map-Reduce 的集群实现包含 k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift;
- Distributed Naive Bayes 和 Complementary Naive Bayes 分类实现;
- 针对进化编程的分布式实用性功能;
- Matrix 和矢量库。
XGBoot至少比现有的梯度上升实现有至少10倍的晋升,同时还供给了多种目标函数,包含回归、分类和排序。因为它在猜测机能上的强大年夜,XGBoot成为很多比赛的幻想选择,其还具有做交叉验证和发明关键变量的额外功能。
应用 Mahout 还可实现内容分类。Mahout 今朝支撑两种根据贝氏统计来实现内容分类的办法:第一种办法是应用简单的支撑 Map-Reduce 的 Naive Bayes 分类器;第二种办法是 Complementary Naive Bayes,它会测验测验改┞俘Naive Bayes办法中的一些问题,同时仍然可以或许维削发单性和速度。
- 开辟说话:Java
- 许可协定:Apache
- GitHub项目地址: https://github.com/apache/mahout
25. Seldon Server
为了实现这一目标,HLearn采取了与标准进修库完全不合的接口。在HLearn中H代表着三个不合的概念,这三个概念也是HLearn设计的根本请求:
- H代表Haskell。机械进修是大年夜数据中猜测函数,所以功能性编程说话适应机械进修是完全说的通的。但功能性编程说话并没广泛应用于机械进修,这是因为它们固来缺乏支撑进修算法的快速数值计算才能。HLearn经由过程采取Haskell中的SubHask库获得了快速数值计算才能;
- H同时代表着Homomorphisms。Homomorphisms是抽象代数的根本概念,HLearn将该代数构造用于进修体系中;
- H还代表着History monad。在开辟新的进修算法过程中,最为艰苦的义务之一就是调试优化过程。在此之前,是没有办法减轻调试过程的工作量的,但History monad正在试图解决该问题。它可以让你在全部线程优化代码的过程中无需修改原代码。此外,应用该技巧时没有增长其他的运行开销。
Seldon是一个开放式的猜测平台,供给内容建议和一般的功能性猜测。它在Kubernetes集群内运行,是以可声调配到Kubernetes范围内的任一地址:内部安排或云安排(例如,AWS、谷歌云平台、Azure)。别的,它还可以衡量大年夜型企业安装的需求。
- 开辟说话:Java
- GitHub项目地址: https://github.com/SeldonIO/seldon-server
26. Datumbox - Framework
Datumbox机械进修框架是用Java编写的一个开源框架,该框架的涵盖大年夜量的机械进修算法和统计办法,并可以或许处理大年夜尺寸的数据集。
Datumbox API供给了海量的分类器和天然说话处理办事,可以或许被应用在很多范畴的应用,包含了情感分析、话题分类、说话检测、主不雅分析、垃圾邮件检测、浏览评估、关键词和文本提取等等。今朝,Datumbox所有的机械进修办事都可以或许经由过程API获取,该框架可以或许让用户敏捷地开辟本身的智能应用。今朝,基于GPL3.0的Datumbox机械进修框架已经开源并且可以大年夜GitHub长进行下载。
Datumbox的机械进修平台很大年夜程度上已经可以或许代替通俗的智能应用。它具有如下几个明显的长处:
- 强大年夜并且开源。Datumbox API应用了强大年夜的开源机械进修框架Datumbox,应用其高度精确的算法可以或许敏捷地构建立异的应用;
- 易于应用。平台API十分易于应用,它应用了REST&JSON的技巧,对于所有的分类器;
- 敏捷应用。Datumbox去掉落了那些很花时光的复杂机械进修练习模型。用户可以或许经由过程平台直接应用分类器。
Datumbox重要可以应用在四个方面:一个是社交媒体的监督,评估用户不雅点可以或许经由过程机械进修解决,Datumbox可以或许赞助用户构建本身的社交媒体监督对象;第二是搜刮引擎优化,个中异常有效的办法就是文档中重要术语的定位和优化;第三点是质量评估,在在线通信中,评估用户产生内容的质量对于去除垃圾邮件是异常重要的,Datumbox可以或许主动的评分并且审核这些内容;最后是文本分析,天然说话处理和文本分析对象推动了网上大年夜量应用的产生,平台API可以或许很轻松地赞助用户进行这些分析。
- 开辟说话:Java
- 许可协定:Apache License 2.0
- GitHub项目地址: https://github.com/datumbox/datumbox-framework
27. Jubatus
Jubatus库是一个运行在分布式情况中的在线机械进修框架,即面向大年夜数据数据流的开源框架。它和Storm有些类似,但可以或许供给更多的功能,重要功能如下:
- 在线机械进修库:包含分类、聚合和推荐;
- Fv_converter: 数据预处理(用天然说话);
- 在线机械进修框架,支撑容错。
推荐阅读
1.断点调试是啥?难不难?断点调试其实并不是多么复杂的一件事,简单的懂得无外呼就是打开浏览器,打开sources找到js文件,在行号上点一下罢了。操作起来似乎很简单,其实很多人纠结的是,是>>>详细阅读
本文标题:28款GitHub最流行的开源机器学习项目:TensorFlow排榜首
地址:http://www.17bianji.com/lsqh/34852.html
1/2 1