【51CTO.com原创稿件】阿里妈妈,是一个想让世界没有难做的营销的大年夜数据平台,它拥有阿里巴巴集团的核心贸易数据。在这里,天天有跨越50亿的推广流量完成跨越3亿件商品的推广展示,覆盖高达98%的网平易近,实现数字媒体(PC端+无线端+互联网电视端)的一站式触达。
在这些鲜亮的数据背后,是什么样的核默算法在起感化?它若何包管商家的产品获得最有效的推荐?本文将给大年夜家详解阿里妈妈 CTR 预估核默算法 MLR 的研发背景和应用实践。
一、关键词小常识
点击经由过程率 CTR(Click-Through-Rate),指收集告白(图片告白/文字告白/关键词告白/排名告白/视频告白等)的点击达到率,即该告白的实际点击次数除以告白的┞饭现量。
CTR 预估是互联网计算告白中的关键技巧环节,预估精确性直接影响商家的告白收入。告白范畴的 CTR 预估面对的是超高维离散特点空间中模式发明的挑衅,即若何拟合现稀有据的规律,同时又具备推广性。
二、CTR预估算法
传统CTR预估算法和非线性模型存在的不足
业界传统的 CTR 预估解法是广义线性模型 LR (logistic regression,逻辑斯特回归)+人工特点工程。LR 应用了 Logit 变换将函数值映射到0~1区间,映射后的函数值就是 CTR 的预估值。LR 这种线性模型很轻易并行化,处理上亿条练习样本不是问题。
推荐阅读
5G最快于来岁韩国平昌冬奥会上大年夜范围商用,估计在2020年周全铺开。昨日,工信部发文明白了第五代国际移动>>>详细阅读 地址:http://www.17bianji.com/lsqh/35645.html 1/2 1