3.3.1 组合特点
对于特点的处理,我们沿用了今朝业内通用的办法,比如归一化、标准化、离散化等。但值得一提的是,我们将很多组合特点惹人到模型练习中。因为不合特点之间的组合是异常有效的,并有很好的可解释性,比如我们将”商户是否在用户常驻地”、”用户是否在常驻地”以及”商户与用户当前距离”进行组合,再将数据进行离散化,经由过程组合特点,我们可以很好的抓住离散特点中的内涵接洽,为线性模型增长更多的非线性表述。组合特点的定义为:
3.3.2 归一化
Min-Max:
Min是这个特点的最小值,Max是这个特点的最大年夜值。
Cumulative Distribution Function(CDF):CDF也称为累积分布函数,数学意义是表示随机变量小于或等于其某一个取值x的概率。其公式为:
在我们线下实验中,持续特点在经由CDF的处理后,比拟于Min-Max,CDF的线下AUC进步不足0.1%。我们猜想是因为有些持续特点并不知足在(0,1)上平均分布的随机函数,CDF在这种情况下,不如Min-Max来的直不雅有效,所以我们在线上采取了Min-Max办法。
3.3.3 快速聚合
为了让模型更快的聚合,并且付与收集更好的表示情势,我们对原始的每一个持续特点设置了它的super-liner和sub-liner,即对于每个特点x,衍生出2个子特点:
实验结不雅表示,经由过程对每一个持续变量惹人2个子特点,会进步线下AUC的表示,但推敲到线上计算量的问题,并没有在线上实验中添加这2个子特点。
推荐阅读
自成立之日起,特斯拉电动汽车公司就承诺要推出一款大年夜众型电动汽车。美国本地时光7月28日,这款汽车终于面世。在位于加州的工厂中,特斯拉向首批30位买家交付了Model 3。美国主流收集>>>详细阅读
本文标题:深度学习在美团点评推荐平台排序中的运用
地址:http://www.17bianji.com/lsqh/36483.html
1/2 1