作家
登录

亿级推广流量仍能精准推荐?解读核心算法的应用实践

作者: 来源: 2017-06-08 14:03:54 阅读 我要评论

用户部分特点(包含 userid、profile 信息、用户在淘宝平滔喔赡汗青行动特点(浏览/购买过的瑰宝/商号/类目上的 id 和频次等)

  • 稀少性:MLR 在建模时惹人了和范数正则,使得最终练习出来的模型具有较高的稀少度, 模型的进修和在线猜测机能更好。

  • MLR算法高等特点

    在具体的实践应用中,阿里妈妈精准定向团队进一步成长了 MLR 算法的多种高等特点,重要包含:

    构造先验。基于范畴常识先验,灵活地设定空间划分与线性拟合应用的不合特点构造。它有助于赞助模型缩小解空间的摸索范围,收敛更轻易。

    线性偏置。这个特点供给了一个较好的办法解决 CTR 预估问题中的 bias 特点,如地位、资本位等。实际应用中,工程师经由过程对地位 bias 信息的建模,获得了 4% 的 RPM晋升效不雅。

    模型级联。MLR 支撑与 LR 模型的级联式结合练习,这有点类似于 wide&deep learning。一些强 feature 设备成级联模式有助于进步模型的收敛性。

    MLR 算法面向的是工业级的数据,例如亿级特点,百亿级样本。是以,工程师设计了一套分布式架构,以支撑模型的高效并行练习。

    典范的应用办法是:以统计反馈类特点构建第一层模型,它的输出(如下图中的 FBCtr)级联到第二级大年夜范围稀少 ID 特点体系中去,可以或许获得更好的晋升效不雅。

    同样地,基于 MLR 算法的非线性才能,他们可以很轻易地将不合的特点源、标签体系融合到框架中,不须要过多地存眷和设计特点的交叉组合,使得框架的灵活性大年夜大年夜加强。


    点击率预估(Click-Through Rate Prediction)是互联网主流应用(告白、推荐、搜刮等)的核默算法问题。

    大年夜范围分布式实现

    下图是架构示意图,它跟传统的 parameter server 架构略有差别,重要不合点在于每一个分布式节点上同时安排了 worker 和 server 两种角色,而不是将 server 零丁剥离出去安排。如许做是为了充分应用每个节点的 CPU 和内存,大年夜而包管最大年夜化机械的资本应用率。


      推荐阅读

      三大运营商5G部署上路!工信部敲定初始频段

    5G最快于来岁韩国平昌冬奥会上大年夜范围商用,估计在2020年周全铺开。昨日,工信部发文明白了第五代国际移动>>>详细阅读


    本文标题:亿级推广流量仍能精准推荐?解读核心算法的应用实践

    地址:http://www.17bianji.com/lsqh/35645.html

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)