作家
登录

有助于你掌握机器学习的十三个框架

作者: 来源: 2017-09-06 16:54:42 阅读 我要评论

作为人工智能的重要分支,机械进修获得越来越多的应用,若何更快地控制这门技巧,这篇文┞仿也许会给你打开一扇大年夜门,下面是译文:

在以前的一年迈,机械进修炙手可热。机械进修的“忽然”降临,并不纯真因为便宜的云情况和更强有力的GPU硬件。也是因为开放源码框架的爆炸式增长,这些框架将机械进修中最难的部分抽象出来,并将这项技巧供给给更广大年夜范围的开辟者。

这里有十来个新鲜出炉的机械进修框架,既有初次露面的,也有从新修悛改的。这些对象被大年夜众所留意,或是因为其出处,或是因为以新鲜的简单办法处理问题,或是解决了机械进修中的某个特定难题,或者是上述的所有原因。

有助于你控制机械进修的十三个框架

Apache Spark MLlib

Apache Spark 最为人所知的是它是Hadoop家族的一员,然则这个内存数据处理框架倒是脱檀竽暌冠Hadoop之外,也正在Hadoop生态体系以外为本身获得了名声。Hadoop 已经成为可供应用的机械进修对象,这得益于其赓续增长的算法库,这些算法可以高速度应用于内存中的数据。

早期版本的Spark 加强了对MLib的支撑,MLib是重要面向数学和统计用户的平台,它许可 经由过程持久化管道特点将Spark机械进修工作挂起和恢复。2016年宣布的Spark2.0,对Tungsten高速内存治理体系和新的DataFrames流媒体API 进行了改进,这两点都邑晋升机械进修应用的机能。

有助于你控制机械进修的十三个框架

H2O

H2O,如今已经成长到第三版,可以供给经由过程通俗开辟情况(Python, Java, Scala, R)、大年夜数据体系(Hadoop, Spark)以及数据源(HDFS, S3, SQL, NoSQL)拜访机械进修算法的门路。H2O是用于数据收集、模型构建以及办事猜测的端对端解决筹划。例如,可以将模型导出为Java代码,如许就可以在很多平台和情况中进行猜测。

H2O可以作为原生Python库,或者是经由过程Jupyter Notebook, 或者是 R Studio中的R 说话来工作。这个平台也包含一个开源的、基于web的、在H2O中称为Flow的情况,它支撑在练习过程中与数据集进行交互,而不只是在练习前或者练习后。

有助于你控制机械进修的十三个框架

Apache Singa

“深度进修”框架加强了重义务类型机械进修的功能,如天然说话处理和图像辨认。Singa是一个Apache的孵化器项目,也是一个开源框架,感化是使在大年夜范围数据集上练习深度进修模型变得更简单。

Singa供给了一个简单的编程模型,用于在机械群集上练习深度进修收集,它支撑很多通俗类型的练习工作:卷积神经收集,受限玻尔兹曼机 以及轮回神经收集。 模许可以同步练习(一个接一个)或者也异步(一路)练习,也可以许可在在CPU和GPU群集上,很快也会支撑FPGA。Singa也经由过程Apache Zookeeper简化了群集的设置。

Caffe2

深度进修框架Caffe开辟时秉承的理念是“表达、速度和模块化”,最初是源竽暌冠2013年的机械视觉项目,此后,Caffe还获得扩大接收了其他的应用,如语音和多媒体。

因为速度放在优先地位 ,所以Caffe完全用C+ +实现,并且支撑CUDA加快,并且根据须要可以在CPU和GPU处理间进行切换。分发内容包含免费的用于通俗分类义务的开源参考模型,以及其他由Caffe用户社区创造和分享的模型。

一个新的由Facebook 支撑的Caffe迭代版本称为Caffe2,如今正在开辟过程中,即将进行1.0宣布。其目标是为了简化分布式练习和移动安排,供给对于诸如FPGA等新类型硬件的支撑,并且应用先辈的如16位浮点数练习的特点。

有助于你控制机械进修的十三个框架

Google的TensorFlow

与微软的DMTK很类似,Google TensorFlow 是一个机械进修框架,旨在跨多个节点进行扩大。 就像Google的 Kubernetes一样,它是是为懂得决google内部的问题而设计的,google最终照样把它作为开源产品宣布出来。

TensorFlow实现了所谓的数据流图,个中的批量数据(“tensors”)可以经由过程图描述的一系列算法进行处理。体系中数据的移动称为“流”-其名也是以得来。这些图可以经由过程C++或者Python实现并且可以在CPU和GPU长进行处理。

TensorFlow比来的进级进步了与Python的兼容性,改进了GPU操作,也为TensorFlow可以或许运行在更多种类的硬件上打开了便利之门,并且扩大了内置的分类和回归对象库。

有助于你控制机械进修的十三个框架

亚马逊的机械进修

亚马逊在供给机械进修即办事-亚马逊机械进修方面也是如斯。该办事可以连接到存储在亚马逊 S3、Redshift或RDS上的数据,并且在这些数据上运行二进制分类、多级分类或者回归以构建一个模型。然则,值得留意的是生成的模型不克不及导入或导出,而练习模型的数据集不克不及跨越100GB。

然则,亚马逊机械进修展示了机械进修的实用性,而不只是奢跋扈品。对于那些想要更进一步,或者与亚马逊云保持不那么慎密接洽的仁攀来说,亚马逊的深度进修机械图景包含了很多重要的深度进修框架,包含 Caffe2、CNTK、MXNet和TensorFlow。


  推荐阅读

  深入浅出:如何从0开始学习大数据挖掘分析?

文┞仿梳理了进修大年夜数据发掘分析的思路与步调,给大年夜家供给一些参考,欲望可以或许对你有所赞助。比来有很多人咨询,想进修大年夜数据,但不知道怎么入手,大年夜哪里开端进修,须>>>详细阅读


本文标题:有助于你掌握机器学习的十三个框架

地址:http://www.17bianji.com/lsqh/37190.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)