作家
登录

28款GitHub最流行的开源机器学习项目:TensorFlow排榜首

作者: 来源: 2017-04-19 14:45:51 阅读 我要评论

如今机械进修逐渐成为行业热点,经由二十几年的成长,机械进修今朝也有了十分广泛的应用,如:数据发掘、计算机视觉、天然说话处理、生物特点辨认、搜刮引擎、医学诊断、DNA序列测序、语音和手写辨认、计谋游戏和机械人等方面。

1. TensorFlow


TensorFlow 是谷歌宣布的第二代机械进修体系。据谷歌传播鼓吹,在朝分基准测试中,TensorFlow的处理速度比第一代的DistBelief加快了2倍之多。

具体的讲,TensorFlow是一个应用数据流图(Data Flow Graphs)进行数值计算的开源软件库:图中的节点(Nodes)代表数学运算操作,同时图中的边(Edges)表示节点之间互相流畅的多维数组,即张量(Tensors)。这种灵活的架构可以让应用者在多样化的将计算安排在台式机、办事器或者移动设备的一个或多个CPU上,并且无需重写代码;同时任一基于梯度的机械进修算法均可够借鉴TensorFlow的主动分化(Auto-differentiation);此外经由过程灵活的Python接口,要在TensorFlow中表达设法主意也变得更为简单。

TensorFlow最初由Google Brain小组(该小组附属于Google's Machine Intelligence研究机构)的研究察和工程师开辟出来的,开辟目标是用于进行机械进修和深度神经收集的研究。但该体系的通用性足以使其广泛用于其他计算范畴。

今朝Google 内部已在大年夜量应用 AI 技巧,包含 Google App 的语音辨认、Gmail 的主动答复功能、Google Photos 的图片搜刮等都在应用 TensorFlow 。

  • 开辟说话:C++
  • 许可协定:Apache License 2.0
  • GitHub项目地址:https://github.com/tensorflow/tensorflow

2. Scikit-Learn

Scikit-Learn是用于机械进修的Python 模块,它建立在SciPy之上。该项目由David Cournapeau 于2007年创建,当时项目名为Google Summer of Code,自此之后,浩瀚自愿者都为此做出了供献。

重要特点:

  • 操作简单、高效的数据发掘和数据分析
  • 无拜访限制,在任何情况下可从新应用
  • 建立在NumPy、SciPy 和 matplotlib基本上

注:Scikit-Learn以前被称为Scikits.Learn。

  • 开辟说话:Python
  • 许可协定:3-Clause BSD license
  • GitHub项目地址: https://github.com/scikit-learn/scikit-learn

3. Caffe

Caffe 是由神经收集中的表达式、速度、及模块化产生的深度进修框架。后来它经由过程伯渴攀利视觉与进修中间(BVLC)和社区介入者的供献,得以成长形成了以一个伯渴攀利主导,然后加之Github和Caffe-users邮件所构成的一个比较松散和自由的社区。

Caffe是一个基于C++/CUDA架构框架,开辟者可以或许应用它自由的组织收集,今朝支撑卷积神经收集和全连接神经收集(人工神经收集)。在Linux上,C++可以经由过程敕令行来操作接口,对于MATLAB、Python也有专门的接口,运算上支撑CPU和GPU直接无缝切换。

Caffe的特点:

  • 易用性:Caffe的模型与响应优化都是以文本情势而非代码情势给出, Caffe给出了模型的定义、最优化设置以及预练习的权重,便利快速应用;
  • 速度快:可以或许运行最棒的模型与海量的数据;
  • Caffe可与cuDNN结合应用,可用于测试AlexNet模型,在K40上处理一张图片只须要1.17ms;
  • 模块化:便于扩大到新的义务和设置上;
  • 应用者可经由过程Caffe供给的各层类型来定义本身的模型;

今朝Caffe应用实践重要稀有据整顿、设计收集构造、练习结不雅、基于现有练习模型,应用Caffe直接辨认。

  • 开辟说话:C++
  • 许可协定: BSD 2-Clause license
  • GitHub项目地址: https://github.com/BVLC/caffe

4. PredictionIO

PredictionIO 是面向开辟人员和数据科学家的开源机械进修办事器。它支撑事宜采集、算法调剂、评估,以及经由REST APIs的猜测结不雅萌芽。应用者可以经由过程PredictionIO做一些猜测,比如个性化推荐、发明内容等。PredictionIO 供给20个预设算法,开辟者可以直接将它们运行于本身的数据上。几乎任何应用与PredictionIO集成都可以变得更“聪慧”。其重要特点如下所示:

  • 基于已稀有据可猜测用户行动;
  • 应用者可选择你本身的机械进修算法;
  • 无需担心可扩大性,扩大性好。

PredictionIO 基于 REST API(应用法度榜样接口)标准,不过它还包含 Ruby、Python、Scala、Java 等编程说话的 SDK(软件开辟对象包)。其开辟说话是Scala说话,数据库方面应用的是MongoDB数据库,计算体系采取Hadoop体系架构。

  • 开辟说话:Scala
  • 许可协定: Apache License 2.0
  • GitHub项目地址: https://github.com/PredictionIO/PredictionIO

5. Brain

Scikit-Learn的根本功能重要被分为六个部分:分类、回归、聚类、数据降维、模型选择、数据预处理,具体可以参考官方网站汕9依υ?档。经由测试,Scikit-Learn可在 Python 2.6、Python 2.7 和 Python 3.5上运行。除此之外,它也应当可在Python 3.3和Python 3.4上运行。

当 brain 用于节点中,可应用npm安装:

  1. npm install brain 

当 brain 用于浏览器,下载最新的 brain.js 文件。练习计算价值比较昂贵,所以应当离线练习收集(或者在 Worker 上),并应用 toFunction() 或者 toJSON()选项,以便将预练习收集插入到网站中。

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)