1.常见算法套路
长处:冷启动,其实只要你有商品的数据,安营业初期用户数据不多的情况下,也可以做推荐
缺点:预处理复杂,任何一件商品,维度可以说至少可以上百,若何拔取合适的维度进行计算,设计到工程经验,这些也是花钱买不到的
典范:亚马逊早期的推荐体系
- 基于接洽关系规矩:最常见的就是经由过程用户购买的习惯,经典的就是“啤酒尿布”的案例,然则实际运营中这种办法应用的也是起码的,起重要做接洽关系规矩,数据量必定要充分,不然置信度太低,当数据量上升了,我们有更多优良的办法,可以说没有什么亮点,业内的算法有apriori、ftgrow之类的
长处:简单易操作,上手速度快,安排起来也异常便利
缺点:须要有较多的数据,精度效不雅一般
长处:相对精准,结不雅可解释性强,副产品可以得出商品热点排序
缺点:计算复杂,数据存储瓶颈,冷门物品推荐效不雅差
典范:早期一号店商品推荐
- 基于用户的协同推荐:假设用户A买过可乐、雪碧、火锅底料,用户B买过卫生纸、衣服、鞋,用户C买过分锅、不雅汁、七喜;直不雅上来看,用户A和用户C类似度更高(相对于用户B),如今我们可以对用户A推荐用户C买过的其他器械,对用户C推荐用户A买过买过的其他器械,优缺点与基于物品的协同推荐类似,不反复了。
- 基于模型的推荐:svd+、特点值分化等等,将用户的购买行动的矩阵拆分成两组权重矩阵的乘积,一组矩阵代表用户的行动特点,一组矩阵代表商品的重要性,在用户推荐过程中,计算该用户在汗青练习矩阵下的各商品的可能性进行推荐。
长处:精准,对于冷门的商品也有很不错的推荐效不雅
缺点:计算量异常大年夜,矩阵拆分的效能及才能瓶颈一向是受束缚的
典范:惠普的电脑推荐
- 基于时序的推荐:这个比较特别,在电商应用的少,在Twitter,Facebook,豆瓣应用的比较多,就是只有赞成和否决的情况下,怎么进行评论排序,具体的可以拜见我之前写的一篇文┞仿:应用:推荐体系-威尔逊区间法
- 基于深度进修的推荐:如今比较火的CNN(卷积神经收集)、RNN(轮回神经收集)、DNN(深度神经收集)都有应用在推荐膳绫擎的例子,然则都照样实验阶段,然则有个基于word2vec的办法已经比拟较较成熟,也是我们今天介绍的重点。
长处:推荐效不雅异常精准,所须要的基本存储资本较少
缺点:工程应用不成熟,模型练习调参技能难
典范:苏宁易购的会员商品推荐
2.item2vec的工程惹人
如今苏宁的商品有约4亿个,商品的类目有10000多组,大年夜的品类也有近40个,如不雅经由过程传统的协同推荐,及时F算的话,办事器成本,计算才能都是异常大年夜的局限,之前已经有过几篇应用介绍:基于推荐的交叉发卖、基于用户行动的推荐预估。会员研发部分因为不是重要推荐的应用部分,所以在选择上,我们期望的是加倍高效高速且相对精确的简约版模型方法,所以我们这边基于了word2vec的原始算法,仿造了itemNvec的方法。
起首,让我们对itemNvec进行理论拆分:
part>
这是两个用户userA,userB在易购膳绫擎的花费time line,灰色方框内为我们不雅察对象,试问一下,如不雅换一下灰色方框内的userA、userB的购买物品,直不雅的可能性有多大年夜?
直不雅的体验告诉我们,这是弗成能出现,或者绝对不是常出现的,所以,我们就有一个初始的假设,对于某些用户在特定的类面前目今,用户的花费行动是持续影响的,换句话说,就是我买了什么器械是依附我之前买过什么器械。若何经由过程算法说话解释膳绫擎说的┞封件事呢?
大年夜家回想一下,naive bayes做垃圾邮件分类的时刻是怎么做的?
假设“我公司可以供给发票、军器出售、航母维修”这句话是不是垃圾邮件?
- P1(“垃圾邮件”|“我公司可以供给发票、军器出售、航母维修”)
- =p(“垃圾邮件”)p(“我公司可以供给发票、军器出售、航母维修”/“垃圾邮件”)/p(“我公司可以供给发票、军器出售、航母维修”)
- =p(“垃圾邮件”)p(“发票”,“军器”,“航母”/“垃圾邮件”)/p(“发票”,“军器”,“航母”)
同理
- P2(“正常邮件”|“我公司可以供给发票、军器出售、航母维修”)
推荐阅读
创建网站备份应当是一个网站治理员最为重要的日常工作之一。但实际情况是,备份这一步往往被很多人忽视,也就是说仍然有很多网管的网站安然意识较低。所有的Linux/Mac用户都可以或许零经济>>>详细阅读
本文标题:深度学习在电商商品推荐当中的应用
地址:http://www.17bianji.com/lsqh/37112.html
1/2 1