沙龙晃荡 | 去哪儿、陌陌、ThoughtWorks在主动化运维中的实践!10.28不见不散!
在一个网站或者app中,推荐体系平日会和全部大年夜体系的多个方面有交互,推荐体系本身也有很多的构成部分,再加上全部体系所处的大年夜情况,综合起来话苄很多身分影响着一个推荐体系最终效不雅的短长,这里的效不雅指的是包含精确率、召回率、多样性等等指标在内的一个整体整体效不雅,不做具体区分。在这里我们试对个一一些重要的身分做一评论辩论。须要指出的是,这些身分琅绫擎并不是所有的我们都可以阁下,然则懂得它们毕竟是什么对我们开辟和优化体系照样异常有效的。
与告白体系须要同时面对用户和告白主不合,推荐体系的办事对象只有一个,那就是用户,所以用户的身分很大年夜程度会影响体系的效不雅。具体来讲,体系中新用户和老用户的比例可以说是对效不雅影响最大年夜的身分之一。大年夜家知道推荐体系是高度依附用户行动的,而对于无任何行动或者行动异常少的新用户,效不雅肯定是不会太好的,所以全部体系中新用户的比例越高,体系的┞符体表示就会越差。
这就是一个典范的推荐体系本身无办法右的身分,而是须要全部体系合营尽力来解决。对于这个问题,有两种解决思路:一种是尽力优化推荐体系的冷启动算法,这种办法肯定话苄效,然则其天花板也是异常低的;而另一种办法,是尽力将平滔喔赡新用户转化为老用户,也就是说尽力让他们与平台多交互,产生行动,大年夜而脱朗攀冷启动的阶段。这两种办法比拟,可能第二种的效不雅要更好,这主如果因为冷启动算法的优化空间实袈溱有限,而将其转为“热”用户之后,各类优化策略就都可以派上用处了。这也是一种可以在多种场景下借鉴的思路:将未知问题转化为已知问题,而不是创造新问题。
产品设计身分
所谓产品设计身分,指的是推荐出的物品在什愦地位、以何种情势展示给用户。如不雅说推荐算法是一小我的内涵,那么产品设计就是一小我的脸。在如今这个看脸的时代,长得好欠好看会很大年夜程度上影响算法能量邓晔着程度。最常见的影响效不雅的外在身分包含但不限于:
图片的质量。互联网早已进入读图时代,无论任何物品的推荐,例如商品、资讯等,有图片的吸引力必定是大年夜于无图片的。而对于都有图片的情况,图片的大年夜小和清楚度则会对用户是否感兴趣产生很大年夜影响。除了大年夜小和清楚度这种基本的质量以外,图片本身传达出来的信息的质量也很关键,例如对于商品的图片,如不雅不克不及在图片中展示出该商品的重要信息和用户关怀的内容,那么竽暌姑户点击的概率就会大年夜大年夜降低,毕竟大年夜家都很忙,点一下也是有价值的。所以对于C2C市场如许以用户本身拍摄的┞氛片为主的场景,引导用户拍出高质量的商品图片就显得尤为重要,这个问题上Airbnb自费给房帜┝寺氛片的故事已经足够证实其重要性和意义了。
用户身分
主题的吸引程度。除了图片以外,以文字情势描述的主题也是异常重要的,毕竟文字照样人们获守信息的一个重要门路。在转转平台上,会有一些偷懒的用户在文字描述中只写类似“如图,私聊”如许的信息,可想而知如许的描述竞争力是比较弱的,同时也会让人认为卖家对这个商品并不是很上心,所以除非你的商品在其他方面极具竞争力,不然是很难获点缀化的。
关键信息是否露出。所谓关键信息,指的是可以或许阁下或影响用户产生点击、转化的信息,除了膳绫擎提到的图片和文字描述以外,各个营业场景下都有一些有特点的关键信息 ,例如销量、评论数等等。一部分是因为这些信息本身就会对用户的转化产生影响,另一方面,推荐算法在召回或排序时可能用到了这些信息,那么将这些信息展示出来,必定程度上充当了推荐解释的功能。
是否有干扰信息。这个指的是模块四周是否有影响用户留意力的其他内容,可否让用户比较专心肠浏览推荐模块。典范的如一些亮闪闪的告白或者促销/晃荡banner之类的,放在推荐位的旁边会对用户的留意力产生不合程度的影响,进而影响转化。如不雅推荐体系在你的营业中是重要的一部分,那么就应当赐与它足够专注(dedicated)的空间和地位,而尽量不要将其与其他内容混在一路。在这个纷纷复杂的世界里,很多时刻,少就是多(less is more)。
数据身分
推荐体系是典范算法驱动的体系,而如不雅说算法是体系的骨架,那么数据就是体系的血液。如不雅数据质量和数量不敷,那么任何算法的效不雅都邑打扣头。数据的数量不足是很轻易懂得的,并且数据量是否充分很多时刻和全部网站或APP的成长状况有关,不是我们所能阁下的,但数据质量则不合,是可以经由过程工资的尽力而赓续加强的。所以这里就R单说一下数据质量方面常见的可能存在的问题。
关键信息缺掉。信息缺掉是数据质量方面最大年夜的问题之一,尤其是影响到算法策略或排序模型的关键信息。例如曝光数据中没有具体曝光地位信息,展示日记中没有效户逗留时长的信息等等,这些信息切实其实实会直接导致算法效不雅的降低,进而影响最终效不雅。类似这些问题的出现,很多时刻是因为在最初的数据体系扶植时,没有算法相干的人员介入,导致没有把这些相干信息设计进去。不过这类问题也相对好解决,只要在发明出缺掉之后尽快弥补进去就好了。
数据设计欠佳,应用复杂。还有一种情况,就是关键信息都有,没有严重缺掉,然则数据构造或表构造设计不敷合理,导致获取一个信息要join多张表,或经由复杂的运算逻辑。这种情况下,固然关键信息都可以获取到,然则因为获取成本高,很有可能在工程实现中被不合程度地做折中,导致数据质量打扣头,影响最终效不雅。这类问题的解决办法,大年夜大年夜的思路上来讲是要做好算法相干的数据仓库/数据集市扶植,使得数据的获取、更改和保护都尽量简单化,削减数据扶植的成本,大年夜而进步数据的应用效力。
推荐阅读
Ubuntu Kylin 17.10优麒麟中国特供版发布:大批国产软件
当今最风行,也可以说是贸易化自成功的Linux发行版Ubuntu日前正式推出了17.10版本,改进颇多,包含桌面放弃32位、桌面情况改用GNOME、显示办事器默认应用Wayland、窗口控制按钮七年来初次回归…&>>>详细阅读
本文标题:浅谈影响推荐系统效果的一些因素
地址:http://www.17bianji.com/lsqh/38111.html
1/2 1