用户部分特点(包含 userid、profile 信息、用户在淘宝平滔喔赡汗青行动特点(浏览/购买过的瑰宝/商号/类目上的 id 和频次等)
稀少性:MLR 在建模时惹人了和范数正则,使得最终练习出来的模型具有较高的稀少度, 模型的进修和在线猜测机能更好。
MLR算法高等特点
在具体的实践应用中,阿里妈妈精准定向团队进一步成长了 MLR 算法的多种高等特点,重要包含:
构造先验。基于范畴常识先验,灵活地设定空间划分与线性拟合应用的不合特点构造。它有助于赞助模型缩小解空间的摸索范围,收敛更轻易。
线性偏置。这个特点供给了一个较好的办法解决 CTR 预估问题中的 bias 特点,如地位、资本位等。实际应用中,工程师经由过程对地位 bias 信息的建模,获得了 4% 的 RPM晋升效不雅。
模型级联。MLR 支撑与 LR 模型的级联式结合练习,这有点类似于 wide&deep learning。一些强 feature 设备成级联模式有助于进步模型的收敛性。
MLR 算法面向的是工业级的数据,例如亿级特点,百亿级样本。是以,工程师设计了一套分布式架构,以支撑模型的高效并行练习。
典范的应用办法是:以统计反馈类特点构建第一层模型,它的输出(如下图中的 FBCtr)级联到第二级大年夜范围稀少 ID 特点体系中去,可以或许获得更好的晋升效不雅。
同样地,基于 MLR 算法的非线性才能,他们可以很轻易地将不合的特点源、标签体系融合到框架中,不须要过多地存眷和设计特点的交叉组合,使得框架的灵活性大年夜大年夜加强。
点击率预估(Click-Through Rate Prediction)是互联网主流应用(告白、推荐、搜刮等)的核默算法问题。
大年夜范围分布式实现
下图是架构示意图,它跟传统的 parameter server 架构略有差别,重要不合点在于每一个分布式节点上同时安排了 worker 和 server 两种角色,而不是将 server 零丁剥离出去安排。如许做是为了充分应用每个节点的 CPU 和内存,大年夜而包管最大年夜化机械的资本应用率。
推荐阅读
5G最快于来岁韩国平昌冬奥会上大年夜范围商用,估计在2020年周全铺开。昨日,工信部发文明白了第五代国际移动>>>详细阅读
地址:http://www.17bianji.com/lsqh/35645.html
1/2 1