作家
登录

28款GitHub最流行的开源机器学习项目:TensorFlow排榜首

作者: 来源: 2017-04-19 14:45:51 阅读 我要评论

  • GitHub项目地址: https://github.com/harthur/brain
  • 6. Keras

    Keras是极其精简并高度模块化的神经收集库,在TensorFlow 或 Theano 上都可以或许运行,是一个高度模块化的神经收集库,支撑GPU和CPU运算。Keras可以说是Python版的Torch7,对于快速构建CNN模型异常便利,同时也包含了一些最新文献的算法,比如Batch Noramlize,文档教程也很全,在官网上作者都是直接给例子浅近易懂。Keras也支撑保存练习好的参数,然后加载已经练习好的参数,进行持续练习。

    当须要如下请求的深度进修的库时,就可以推敲应用Keras:

    • 推敲到简单快速的原型法(经由过程总体模块性、精简性以及可扩大性);
    • 同时支撑卷积收集和递归收集,以及两者之间的组合;
    • 支撑随便率性连接筹划(包含多输入多输出练习);
    • 可在CPU 和 GPU 上无缝运行。

    Keras今朝支撑 Python 2.7-3.5。

    • 开辟说话:Python
    • GitHub项目地址:https://github.com/fchollet/keras

    Brain是 JavaScript 中的 神经收集库。以下例子解释应用Brain来近似 XOR 功能:

    CNTK(Computational Network Toolkit )是一个同一的深度进修对象包,该对象包经由过程一个有向图精力经收集描述为一系列计算步调。在有向图中,叶节点表示输入值或收集参数,其他节点表示该节点输入之上的矩阵运算。

    CNTK 使得实现和组合如前馈型神经收集DNN、卷积神经收集(CNN)和轮回神经收集(RNNs/LSTMs)等非行模式变得异常轻易。同时它实现了跨多GPU 和办事器主动分化和并行化的随机梯度降低(SGD,误差反向传播)进修。

    下图将CNTK的处理速度(每秒处理的帧数)和其他四个有名的对象包做了比较了。设备采取的是四层全连接的神经收集(拜见基准测试脚本)和一个大年夜小是8192 的高效mini batch。在雷同的硬件和响应的最新公共软件版本(2015.12.3前的版本)的基本上获得如下结不雅:

    CNTK自2015年四月就已开源。

    • 开辟说话:C++
    • GitHub项目地址:https://github.com/Microsoft/CNTK

    8. Convnetjs

    ConvNetJS是应用Javascript实现的神经收集,同时还具有异常不错的基于浏览器的Demo。它最重要的用处是赞助深度进修初学者更快、更直不雅的懂得算法。

    它今朝支撑:

    • 常见的神经收集模块(全连接层,非线性);
    • 分类(SVM/ SOFTMAX)和回归(L2)的成本函数;
    • 指定和练习图像处理的卷积收集;
    • 基于Deep Q Learning的实验强化进修模型。

    12. MXNet

    一些在线示例:

    • Convolutional Neural Network>

      Pattern是Python的一个Web发掘模块。拥有以下对象:

      • 数据发掘:收集办事(Google、Twitter、Wikipedia)、收集爬虫、HTML DOM解析;
      • 天然说话处理:词性标注对象(Part-Of-Speech Tagger)、N元搜刮(n-gram search)、情感分析(sentiment analysis)、WordNet;
      • 机械进修:向量空间模型、聚类、分类(KNN、SVM、 Perceptron);
      • 收集分析:图形中间性和可视化。

      10. NuPIC

      NuPIC是一个实现了HTM进修算法的机械智能平台。HTM是一个关于新(大年夜脑)皮质(Neocortex)的具体人工智能算法。HTM的核心是基于时光的持续进修算法,该算法可以存储和调用时光和空间两种模式。NuPIC可以实用于解决各类问题,尤其是异常检测和流数据源猜测方面。

      NuPIC Binaries文件今朝可用于:

      • Linux x86 64bit
      • OS X 10.9
      • OS X 10.10
      • Windows 64bit

      NuPIC 有本身的独特之处。很多机械进修算法无法适应新模式,而NuPIC的运作接近于人脑,当模式变更的时刻,它会忘掉落旧模式,记忆新模式。

      • 开辟说话:Python
      • GitHub项目地址:https://github.com/numenta/nupic

      11. Theano

      • Theano是一个Python库,它许可应用者有效地定义、优化和评估涉及多维数组的数学表达式,同时支撑GPUs和高效符号分化操作。Theano具有以下特点:
      • 与NumPy慎密相干--在Theano的编译功能中应用了Numpy.ndarray ;
      • 透明地应用GPU--履行数据密集型计算比CPU快了140多倍(针对Float32);
      • 高效符号分化--Theano将函数的导数分为一个或多个不合的输入;
      • 速度和稳定性的优化--即使输入的x异常小也可以获得log(1+x)精确结不雅;
      • 动态生成 C代码--表达式计算更快;
      • 广泛的单位测试和自我验证--多种缺点类型的检测和剖断。

      自2007年起,Theano一向致力于大年夜型密集型科学盘似揭捉?究,但它今朝也很被广泛应用在教室之上( 如Montreal大年夜学的深度进修/机械进修课程)。

      • 开辟说话:Python
      • GitHub项目地址:https://github.com/Theano/Theano

      MXNet是一个兼具效力和灵活性的深度进修框架。它许可应用者将符号编程和敕令式编程相结合,以寻求效力和临盆力的最大年夜化。其核心是动态依附调剂法度榜样,该法度榜样可以动态主动进行并行化符号和敕令的操作。个中安排的图形优化层使得符号操作更快和内存应用率更高。该库轻量且便携带,并且可扩大到多个GPU和多台主机上。

      重要特点:

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)