作家
登录

大数据中的用户画像

作者: 来源: 2017-11-21 15:09:08 阅读 我要评论

  • 别的还有一些特点可以应用,比如用户拜访过的网站,经常拜访一些美妆或女性服饰类网站,是女性的可能性就高;拜访体育军事类网站,是男性的可能性就高。还有效户上彀的时光段,经常深夜上彀的用户男性的可能性就高。把这些特点参加到LR分类器进行练习,也能进步必定的数据覆盖率。
  • 数据治理体系用户画像涉及到大年夜量的数据处理和特点提取工作,往往须要用到多半据来源,且多人并行处理数据和生成特点。是以,须要一个数据治理体系来对数据同一进行归并存储和分发。我们的体系以商定的目次构造来组织数据,根本目次层级为:/user_tag/属性/日期/来源_作者/。以性别特点为例,开辟者dev1大年夜用户姓名提取的性别数据存放路径为 /user_tag/gender/20170101/name_dev1,开辟者dev2大年夜用户填写材料提取的性别数据存放路径为 /user_tag/gender/20170102/raw_dev2。

    大年夜数据中的用户画像

    应用示例:个性化推荐

    以电商网站的某种页面的个性化推荐为例,推敲到特点的可解释性、易扩大和模型的枷⒚机能,很多线上推荐体系采取LR(逻辑回归)模型练习,这里也以LR模型举例。很多推荐场景都邑用到基于商品的协同过滤,而基于商品协同过滤的核心是一个商品相干性矩阵W,假设有n个商品,那么W就是一个n * n的矩阵,矩阵的元素wij代表商品Ii和Ij之间的相干系数。而根据用户拜访和购买商品的行动特点,可以把用户表示成一个n维的特点向量U=[ i1, i2, ……, in ]。于是U*W可以算作取户对每个商品的感兴趣程度V=[ v1, v2, ……, vn ],这里v1等于用户对商品I1的感兴趣程度,v1= i1*w11 + i2*w12 + in*w1n。如不雅把相干系数w11, w12, ……, w1n 算作请求的变量,那么就可以用LR模型,代入练习集用户的行动向量U,进行求解。如许一个初步的LR模型就练习出来了,效不雅和基于商品的协同过滤类似。

    用户画像的感化

    这时只用到了用户的行动特点部分,而人面试性、网购偏好、内容偏好、花费才能和情况特点等其他高低文还没有应用起来。把以上特点参加到LR模型,同时再加上目标商品自身的属性,如文本标签、所属类目、销量等数据,如下图所示,进一步优化练习本来的LR模型。大年夜而最大年夜程度应用已经提取的用户画像数据,做到更精准的个性化推荐。

    大年夜数据中的用户画像

    用户画像是当前大年夜数据范畴的一种典范应用,也广泛应用在多款网易互联网产品中。

    【编辑推荐】

    1. 大年夜数据显示:上海女人最难脱单?看到原因我哭了
    2. 大年夜数据为何这么重要?
    3. 当你老了,平生最懊悔什么?大年夜数据告诉你!
    4. 大年夜数据要怎么竽暌姑,12名创颐魅者如许说
    5. 双十一大年夜数据处理要控制成本
    【义务编辑:未丽燕 TEL:(010)68476606】

      推荐阅读

      长虹佳华林进:传统IT分销商如何从淘宝、京东等电商口中抢食?

    Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践【51CTO.com原创稿件】在IT业,谁也无法忽视分销商的力量,因为分销商在家当经营链条中拥有举足轻重的地位。对上游厂商>>>详细阅读


    本文标题:大数据中的用户画像

    地址:http://www.17bianji.com/lsqh/39094.html

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)