作家
登录

深度学习在美团点评推荐平台排序中的运用

作者: 来源: 2017-08-01 15:12:43 阅读 我要评论

3.2 样本的筛选

数据及特点,是全部机械进修中最重要的两个环节,因为其本身就决定了全部模型的上限。点评推荐因为其自身多营业(包含外卖、商户、团购、酒旅等)、多场景(用户到店、用户在家、异地请求等)的特点,导致我们的样本集比拟于其他产品更多元化。我们的目标是猜测用户的点击行动。有点击的为正样本,无点击的为负样本,同时,在练习时对于购买过的样本进行必定程度的加权。并且,为了防止过拟合/欠拟合,我们将正负样本的比例控制在10%。最后,我们还要对练习样本进行清洗,去除掉落Noise样本(特点值近似或雷同的情况下,分别对应正负两种样本)。

同时,推荐营业作为全部App首页核心模块,对于新鲜性以及多样性的需求是很高的。在点评推荐体系的实现中,起重要肯定应用处景的数据,美团点评的数据可以分为以下几类:

用户画像:性别、常驻地、价格偏好、Item偏好等。

Item画像:包含了商户、外卖、团单等多种Item。个中商户特点包含:商户价格、商户好评数、商户地舆地位等。外卖特点包含:外卖平均价格、外卖配送时光、外卖销量等。团单特点包含:团单实用人数、团单访购率等。

场景画像:用户当前地点地、时光、定位邻近商圈、基于用户的高低文场景信息等。

3.3 深度进修中的特点处理

特点提取:大年夜原始数据出发构造新的特点的过程。办法包含计算各类简单统计量、主成分分析、无监督聚类,在构造办法肯定后,可以将其变成一个主动化的数据处理流程,然则特点构造过程的核心┞氛样手动的。

特点选择:大年夜浩瀚特点中遴选出声许有效特点。与进修目标不相干的特点和冗余特点须要被剔除,如不雅计算资本不足或者对模型的复杂性有限制的话,还须要选择丢弃一些不重要的特点。特点选择办法常用的有以下几种:

大年夜数据

特点选择开销大年夜、特点构造成本高,在推荐营业开展的初期,我们对于这方面的感到还不强烈。然则跟着营业的成长,对点击率预估模型的请求越来越高,特点工程的巨大年夜投入对于效不雅的晋升已经不克不及知足我们需求,于是我们想寻求一种新的解决办法。

深度进修能主动对输入的低阶特点进行组合、变换,获得高阶特点的特点,也促使我们转向深度进修进行摸索。深度进修“主动提取特点”的长处,在不合的范畴有着不合的表示。例如对于图像处理,像素点可以作为低阶特点输入,经由过程卷积层主动获得的高阶特点有比较好的效不雅。在天然说话处理方面,有些语义并不来自数据,而是来自人们的先验常识,应用先验常识构造的特点是很有赞助的。

是以,我们欲望借助于深度进修来节约特点工程中的巨大年夜投入,更多地让点击率预估模型和各帮助模型主动完成特点构造和特点选择的工作,并始终和营业目标保持一致。下面是一些我们在深度进修顶用到的特点处理方法:


  推荐阅读

  特斯拉Model 3驾驶初体验:它会改变一切

自成立之日起,特斯拉电动汽车公司就承诺要推出一款大年夜众型电动汽车。美国本地时光7月28日,这款汽车终于面世。在位于加州的工厂中,特斯拉向首批30位买家交付了Model 3。美国主流收集>>>详细阅读


本文标题:深度学习在美团点评推荐平台排序中的运用

地址:http://www.17bianji.com/lsqh/36483.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)