首页 > 其他分享 >画像体系(一):基础

画像体系(一):基础

时间:2023-08-27 16:45:21浏览次数:34  
标签:体系 架构 画像 基础 用户 系统 标签 数据

 在 浅谈大数据产品经理 一文中提到数据的价值的两大方向,数据决策和产品智能;产品智能方向:精细化运营更强调数据挖掘价值的应用;而要做精细化运营,首先要建立本企业的用户画像。搭建一套用户画像方案整体来说需要考虑8个模块的建设,如下: 

 

主要内容模块包含: 

  • 一、用户画像基础
  • 二、标签指标体系
  • 三、标签平台管理
  • 四、标签数据开发
  • 五、标签数据存储
  • 六、标签调度推数
  • 七、用户画像系统
  • 八、用户画像应用

一、用户画像基础


 1、什么是用户画像

    用户画像是指描述一个用户或用户群体的细节和特征的方法,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。

    概括一句话:即用户信息标签化

2、用户画像架构

     数据参考架构一:

   1)数据底层整理

  • 图中最下方的虚线框中的内容,是常见的数据仓库ETL加工流程,也就是将每日的业务数据、日志数据、埋点数据等经过ETL处理,加工到数据仓库对应的ODS层、DW层、DM层中。
  • 数据指标的的梳理来源于各个系统日常积累的日志记录系统,通过大数据平台接入数据仓库中。
  • 数仓底层主要依托hadoop、hdfs、hive

  2)用户画像建模

  • 中间的虚线框即为用户画像建模的重要环节,即对基于数据仓库ODS层、DW层、DM层中与用户相关的数据的二次建模加工,而用户画像系统并不是产生数据的源头,之后将二次加工后的用户标签结果写入到Hive中
  • 由于不同的数据库有不同的应用场景,后续需要进一步将数据同步到MySQL、HBase、Elasticsearch等数据库中

  3)面向应用

  • 用户标签数据在Hive中加工完成之后,部分标签通同步到MySQL、ES数据库中,提供用于BI报表展示的数据、多为透视分析的数据、圈人服务的数据;
  • 另一部分标签同步到HBase数据库中,用户产品线上个性化推荐

   参考架构二:

 参考架构三:

 参考架构四:

  参考架构五(定位):

  • 相对于数据仓库而言,用户画像属于“上层建筑”,以数据仓库沉淀的数据为基础,提炼出更有价值的信息。 
  • 同时用户画像也是一种数据服务,在它之上还有“更高的建筑”,比如推荐系统,营销系统、风控系统、用于广告投放的DMP系统等等。这些系统往往需要对用户进行识别定位,那么用户画像就是最重要的数据来源。
  • 画像中心的数据全部来源于数仓,但是其又不能直接使用数仓,所以需要按照画像的标准,以用户为单位,将数据再次进行提炼、加工组合,形成以用户标签为中心的数据 

 3、画像开发流程 

1)需求分析

  • 用户画像体系的建设不能凭空捏造,需要根据实际的业务需求,考量画像系统能为业务带来的价值,所以我们第一步要做的是分析业务需求。

2)搭建标签体系

  • 标签是某一种用户特征的符号表示,标签解决的是描述(或命名)问题,但在实际应用中,还需要解决数据之间的关联,所以通常将标签作为一个体系来设计,以解决数据之间的关联问题。
  • 所以说我们在给用户打标签的同时,需要有一个分类标准,简单说,就是你把用户分到多少个类别里面去,这些类是什么,彼此之间有什么关系,就构成了标签体系。

3)建立用户画像和用户画像系统

  • 在把用户数据标签化之后,通过相应的模型或工具,根据数据分析的结果,将用户的特征、兴趣和行为整合成用户画像的形式,可以是文字描述、标签或图表等形式,以便后续使用和分析。
  • 为了提高体验,我们更多的的时候是一个用画像系统。

4)画像应用

  • 应用场景包含 3 类:精准营销、用户分析、个性化推荐。

 5)用户标签的应用价值

    用户特征洞察:

  • 辅助用户分析和用户洞察,用户标签可以帮助业务人员快速的对用户有一个认知,然后发现里面显著的特征,获得一些商业灵感。

   增强数据分析:

  • 标签还可以丰富数据的维度。对我们的业务数据,有更深层次的对比分析,而分析洞察得到的灵感以后,可以辅助业务落地。

  精细化运营:

  • 一方面,可以将用户群体,切割成更细粒度的群组,使得运营从粗放化到精细化,用多种不同的手段,不同的渠道去触达,比如说短信、推送、邮件等等,对于用户进行驱动或召回,从而达到事半功倍的效果。

  数据产品应用:

  • 另一方面,除了驱动人工的业务以外,用户标签还可以成为其他数据产品的基础,比如个性化推荐系统,广告系统,CRM等这些系统。自动化的业务系统能更有效的利用这些用户标签,从而发挥更巨大的威力。

  

参考:


标签:体系,架构,画像,基础,用户,系统,标签,数据
From: https://www.cnblogs.com/tgzhu/p/17640750.html

相关文章

  • 画像体系(三):平台
    一、用户画像基础二、标签指标体系三、标签平台管理四、标签数据开发五、标签数据存储六、标签调度推数七、用户画像系统八、用户画像应用三、标签平台管理 标签平台是一个中间层的服务,为前台提供的是数据支持。另外一方面标签平台的加工,依赖底层的基础数据平台的原......
  • 画像体系(二):标签
    一、用户画像基础二、标签指标体系三、标签平台管理四、标签数据开发五、标签数据存储六、标签调度推数七、用户画像系统八、用户画像应用二、标签指标体系 构成用户的标签可以是多种多样的,也应该能够渗透到丰富的业务场景中去,因而标签就需要兼顾广泛性和精确性,这就......
  • 画像体系(四):系统
    一、用户画像基础二、标签指标体系三、标签平台管理四、标签数据开发五、标签数据存储六、标签调度推数七、用户画像系统八、系统搭建示例七、用户画像系统 自建用户画像系统是互联网企业、在转型的传统企业必经之路。画像系统一方面用于企业精细化运营,提高客单价,通......
  • 【Ehcache技术专题】「入门到精通」带你一起从零基础进行分析和开发Ehcache框架的实战
    Ehcache的存储方式Ehcache中对于缓存的存储主要有三种方式:分别是堆内存、非堆内存和磁盘。其中非堆内存是针对于企业版Ehcache才有的功能,它可以不受JavaGC的影响,能够创建很大的缓存。堆内存(MemoryStore)我们通常所有的MemoryStore实际上就是堆内存存储。MemoryStore总是可用的,所有......
  • Linux 多线程基础
    @TOC前言一、多线程基础函数1.pthread_create创建新的线程。#include<pthread.h> intpthread_create(pthread_t*thread,constpthread_attr_t*attr, void*(*start_routine)(void*),void*arg);参数说明:thread:用于存储新线程的ID。attr:线程属......
  • 多线程基础
    进程在计算机中,我们把一个任务称为一个进程,浏览器就是一个进程,视频播放器是另一个进程。某些进程内部还需要同时执行多个子任务。例如,我们在使用Word时,Word可以让我们一边打字,一边进行拼写检查,我们把子任务称为线程。进程和线程的关系:一个进程可以包含一个或多个线程,但至少会有一个......
  • 零基础学会用Airtest-Selenium对Firefox进行自动化测试
    1.前言本文将详细介绍如何使用AirtestIDE驱动Firefox测试,以及脱离AirtestIDE怎么驱动Firefox(VScode为例)。看完本文零基础小白也能学会Firefox浏览器自动化测试!!!2.如何使用AirtestIDE驱动Firefox浏览器对于Web自动化测试,目前AirtestIDE支持chrome浏览器和Firefox2种浏览器,关于......
  • redis 基础
    随着互联网+大数据时代的来临,传统的关系型数据库已经不能满足中大型网站日益增长的访问量和数据量。这个时候就需要一种能够快速存取数据的组件来缓解数据库服务I/O的压力,来解决系统性能上的瓶颈与其他内存型数据库相比,Redis具有以下特点:Redis不仅可以将数据完全保存在内存......
  • 图论基础
    图论基础树和图的存储无向图:没方向建图需要在两个节点间建两条相反的边add(a,b),add(b,a);有向图:有方向领接矩阵:g[a,b]=权重$a\tob$邻接表(常用):每个点上都有一个单链表,存储该点能到哪些点上去若有权重则加个w[N]数组,以idx为下标记录权值12,324,53NULL......
  • 基础知识
    基础知识redis默认有16个数据库,这个可以在配置文件当中得到验证 而默认使用的是第0个数据库,可以使用select来进行切换数据库,切换成功之后会在端口号后面显示一个2 可以使用dbsize来查看数据库中数据的大小 还可以删除数据库中的数据,有两个命令flushall #删除全部......