开辟者大年夜赛路演 | 12月16日,技巧立异,北京不见不散
现有的机械进修体系都是针对不合类型的机械进修义务而搭建的。数据流体系Hadoop和Spark合适通用的数据处理义务和构建机械进修流水线,但缺乏参数共享机制,存在单点瓶颈机能问题;图计算体系GraphLab、GraphX和Tux2等将机械进修计算抽象成图构造,可以应用图构造的特点进行加快,但只合适具有稀少图构造的算法;深度进修体系TensorFlow、MXNet和Caffe2等应用Parameter Server或者Allreduce办法进行分布式神经收集的练习,其特点是可以或许应用GPU对神经收集的计算进行加快,但缺乏对稀少图构造的优化和支撑。
Angel在设计中对分布式机械进修的共性进行了抽象和提炼。文┞仿认为分布式机械进修的核心部分在于参数共享,如不雅可以供给高效的参数共享机制,则可以或许为各类机械进修义务进行扩大和加快。是以,Angel供给了PS办事的才能,支撑两种运行模式。个一一种模式称为PS Service模式,Angel只启动Master和Parameter Server,具体的计算义务交由其他寂?娼台(如Spark、TensorFlow等)完成,这种模式下Angel只负责供给Parameter Server的功能;在别的一种模式中,Angel还会启动Worker,由Angel负责完成模型的练习。Angel供给PS办事的才能,使其能处理多种类型的机械进修义务,供给更便利的机械进修开辟体验。
Angel是一个基于参数办事器(Parameter Server)理念的分布式机械进修框架,它能让机械进修算法轻松运行于高维度模型之上。Angel环绕模型共享的核心理念,将高维度的大年夜模型合理地切分到多个参数办事器节点,并经由过程高效的模型更新房口和运算函数以及多变的同步协定,实现各类高效的机械进修算法。得益于其优胜的设计,Angel既能自力运行、高效履行多种机械进修算法,亦能作为PS办事,支撑Spark和现有的深度进修框架,为其加快。它基于工业界的海量数据进行了反复的实践和调优,具有广泛的实用性和稳定性,模型维度越高,优势越明显。
此外,Angel还能供给:(1)多种参数同步协定,用于在不合的集群情况中进行加快;(2)易用且丰富的接口,用于便利算法的开辟;(3)数据并行与模型并行的才能,进步算法的扩大性;(4)高效的容错机制,为义务在复杂情况中的运行供给保障。经由在真实数据集上的比较,Angel在多种机械进修算废喔赡机能优于XGBoost、Spark、Petuum、TensorFlow等常用机械进修体系。今朝Angel已经被应用于腾讯视频点击猜测和告白推荐等实际营业中。
Angel的开源体系由北京大年夜学-腾讯协同立异实验室开辟,兼顾了工业界的高可用性和学术界的立异性,已经在GitHub周全开源,集成和优化了Logistic Regression、SVM、KMeans、LDA、MF、GBDT 等多种机械进修算法。Angel今朝基于Java和Scala开辟,将来还会参加Python等多种说话接口,便利应用。将来,Angel的PS Service才能会获得进一步应用,支撑图计算和深度进修框架。
【编辑推荐】
- HPE Apollo体系启用ARM与Skylake比赛
- Linux魏何能成为超算界的操作体系大年夜佬?
- UPS供电体系的蓄电池监控与治理
- 戴尔全新解决筹划将机械进修和深度进修惹人主流企业
- 数据中间计心境柜体系成功安排的关键要素分析
推荐阅读
历时一年,Java 持久层工具 jSqlBox 迎来首个正式版
历时一年开辟,Java持久层对象jSqlBox终于宣布1.0.0正式版,与以前的Snapshot版本相比,1.0.0版本是一个真正面向临盆情况的持久层对象了,可以用于实际开辟了。以下为jSqlBox项目最新版本内容介绍: jS>>>详细阅读
本文标题:Angel:一种新型分布式机器学习系统
地址:http://www.17bianji.com/lsqh/39475.html
1/2 1