作家
登录

28款GitHub最流行的开源机器学习项目:TensorFlow排榜首

作者: 来源: 2017-04-19 14:45:51 阅读 我要评论

  • 随便率性计算图的灵活设备;
  • 整合了各类编程办法的优势最大年夜限度地进步灵活性和效力;
  • 轻量、高效的内存以及支撑便携式的智能设备;
  • 多GPU扩大和分布式的主动并行化设置;
  • 支撑Python、R、C++和 Julia;
  • 对“云计算”友爱,直接兼容S3、HDFS和Azure。
  • MXNet不仅仅是一个深度进修衔目,它更是一个建立深度进修体系的蓝图、指导方针以及黑客们对深度进修体系独特看法的结合体。

    • 开辟说话:Jupyter Notebook
    • 开源许可:Apache-2.0 license
    • GitHub项目地址:https://github.com/dmlc/mxnet

    13. Vowpal Wabbit

    Vowpal Wabbit是一个机械进修体系,该体系推动了如在线、散列、Allreduce、Learning2search、等方面机械进修前沿技巧的成长。 其练习速度很快,在20亿条练习样本,每个练习样本大年夜概100个非零特点的情况下:如不雅特点的总位数为一万时,练习时光为20分钟;特点总位数为1000万时,练习时光为2个小时。Vowpal Wabbit支撑分类、 回归、矩阵分化和LDA。

    当在Hadoop上运行Vowpal Wabbit时,有以下优化机制:

    • 懒惰初始化:在进行All Reduce之前,可将全部数据加载到内存中并进行缓存。即使某一节点出现了缺点,也可以经由过程在别的一个节点上应用缺点节点的数据(经由过程缓存来获取)来持续练习。
    • Speculative Execution:在大年夜范围集群傍边,一两个很慢的Mapper会影响全部Job的机能。Speculative Execution的思惟是昔时夜部分节点的义务完成时,Hadoop可以将残剩节点上的义务拷贝到其他节点完成。

    其他:

    • 开辟说话:C++
    • GitHub项目地址:https://github.com/JohnLangford/vowpal_wabbit

    14. Ruby Warrior

    经由过程设计了一个游戏使得Ruby说话和人工智能进修加倍有乐趣和互动起来。

    应用者扮演了一个勇士经由过程爬上一座高塔,达到顶层获取名贵的红宝石(Ruby)。在每一层,须要写一个Ruby脚本指导兵士打败仇敌、营救俘虏、达到楼梯。应用者对每一层都有一些熟悉,然则你永远都不知道每层具领会产生什么情况。你必须给兵士足够的人工智能,以便让其自行寻找应对的方法。

    勇士的动作相干API:

    • Warrior.walk: 用来控制勇士的移动,默认偏向是往前;
    • warrior.feel:应用勇士来感知前方的情况,比如是空格,照样有怪物;
    • Warrior.attack:让勇士对怪物进行进击;
    • Warrior.health:获取勇士当前的生命值;
    • Warrior.rest:让勇士歇息一回合,恢复最大年夜生命值的10%。

    18. H2O-2

    勇士的感知API:

    • Space.empty:感知前方是否是空格;
    • Space.stairs:感知前方是否是楼梯;
    • Space.enemy: 感知前方是否有怪物;
    • Space.captive:感知前方是否有俘虏;
    • Space.wall:感知前方是否是墙壁。

    其他:

    • 开辟说话:Ruby
    • GitHub项目地址:https://github.com/ryanb/ruby-warrior

    15. XGBoost

    7. CNTK

    XGBoot是设计为高效、灵活、可移植的优化分布式梯度 Boosting库。它实现了 Gradient Boosting 框架下的机械进修算法。

    XGBoost经由过程供给并行树Boosting(也被称为GBDT、GBM),以一种快速且精确的方法解决了很多半据科学问题。雷同的代码可以运行在大年夜型分布式情况如Hadoop、SGE、MP上。它类似于梯度上升框架,然则加倍高效。它兼具线性模型求解器和树进修算法。

    值得留意的是:XGBoost仅实用于数值型向量,是以在应用时须要将所有其他情势的数据转换为数值型向量;在优化模型时,这个算法还有异常多的参数须要调剂。

    • 开辟说话:C++
    • 开源许可:Apache-2.0 license
    • GitHub项目地址:https://github.com/dmlc/xgboost

    GoLearn 是Go 说话中“功能齐备”的机械进修库,简单性及自定义性是其开辟目标。

    在安装 GoLearn 时,数据作为实例被加载,然后可以在其上操作矩阵,并将操作值传递给估计值。GoLearn 实现了Fit/Predict的Scikit-Learn界面,是以用户可轻松地经由过程反复实验置换出估计值。此外,GoLearn还包含用于数据的帮助功能,例如交叉验证、练习以及爆裂测试。

    • 开辟说话:Go
    • GitHub项目地址: https://github.com/sjwhitworth/golearn

    17. ML_for_Hackers

    所有代码均为R说话,依附浩瀚的R法度榜样包,涉及主题包含分类(Classification)、排行(Ranking)、以及回归(Regression)的所有常见的义务和主成分分析(PCA)和多维标准(Multi-dimenstional Scaling)等统计办法。

    • 开辟说话:R
    • 开源许可:Simplified BSD License
    • GitHub项目地址: https://github.com/johnmyleswhite/ML_for_Hackers

    H2O使得Hadoop可以或许做数学运算!它可以经由过程大年夜数据衡量统计数据、机械进修和数学。H2O是可扩大的,用户可以在核心区域应用简单的数学模型构建模块。H2O保存着与R、Excel 和JSON等相类似的熟悉的界面,使得大年夜数据爱好者及专家们可经由过程应用一系列由简单到高等的算法来对数据集进行摸索、变换、建模及评分。采集数据很简单,但判决难度却很大年夜,而H2O却经由过程更快捷、更优化的猜测模型,可以或许加倍简单敏捷地大年夜数据中获得深克看法。

    Keras侧重于开辟快速实验,用可能起码延迟实现大年夜理念到结不雅的改变,即为做好一项研究的关键。

    0xdata H2O的算法是面向营业流程——讹诈或趋势猜测。Hadoop专家可以应用Java与H2O互相感化,但框架还供给了对Python、R以及Scala的绑缚。

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)