一、用户画像概述
1.1 什么是用户画像
用户画像分析是通过挖掘用户的自然属性、社会属性和行为属性,识别用户兴趣点并分析群体特征的过程。它是刻画用户个体或群体全方位特征的重要手段,为运营分析人员提供用户偏好和行为信息,从而优化运营策略,并为产品设计提供准确的用户角色信息。
目前业界常使用的用户画像概念有2种,一种是 User persona,一种 User portrait,也有翻译为User profile。
1.1.1 用户角色(User persona)
根据Alan Cooper的《About Face》,用户角色是基于产品对真实世界的观察,抽象出来的具有代表性的虚拟用户模型,有时也被称为综合的用户原型(Composite User Archetype)。
主要特征如下:
●包含角色描述和用户目标
用户角色不仅涵盖了诸如姓名、年龄、地理位置、收入水平和职业背景等基本信息,以构建一个更加立体、贴近真实的用户形象,更重要的是揭示了该角色背后的驱动力——即用户的真正目的或愿望。这些目标反映了用户为何会使用某一产品或服务,并且是驱动他们行动的关键因素。
●可以代表相似的用户群体或类型,也可以代表个体
尽管用户角色本质上是一个虚构的概念,但它能够有效地概括一群具有共同特性和需求的人群。同时,它也可能聚焦于某个具体的“典型”个体,尽管这并不意味着存在一个完全匹配的实际人物。每个用户角色都是通过对多个真实案例的研究分析后构建而成的。
●强调在特定场景下对特定产品的使用
用户角色研究的是用户在具体情境下对产品的使用,关注其在一定范围内的行为、态度、能力、动机等。即使同一个角色,在不同产品下的动机也是有差异的,一般来说不轻易在不同产品间复用,需要考虑不同类产品的切入场景。
1.1.2 用户画像(User profile/User portrait)
指用户信息标签化,通过收集用户多维度的信息数据(如人口统计属性、社会属性、行为偏好、消费习惯等),并对其进行统计、分析,从而抽象出的用户信息全貌,相比user persona,它更侧重于数据挖掘、标签体系搭建。
这类画像主要特征如下:
- 真实性
- 集合了每个个体的真实信息,如既有人口统计属性等静态信息,也有用户行为的动态信息。
- 时效性
- 用户动态信息并非一层不变,可以实时追踪其变化。
- 覆盖度广
- 既能监测到用户感兴趣的内容,也可以看到其不感兴趣的内容,维度众多,颗粒度粗细均有。
1.1.3 用户角色 对比 用户画像
用户角色 | VS | 用户画像 |
---|---|---|
虚拟的用户模型 | 定义 | 真是的用户数据集 |
用户特征、目标、能力、态度的抽象概括 | 内容 | 用户实时、真实、动态的行为数据统计 |
初期描述目标用户,指导产品设计 | 用途 | 后期跟进用户行为,观察、预测用户行为 |
定性研究 | 方法 | 定量研究+数据分析 |
1.1.4 用户标签
用户标签,即对用户某个维度属性的描述,具有相互独立、可枚举穷尽的特点;采集业务、日志、埋点等数据后,经过不同统计方式计算出用户属性、用户行为、用户消费、风险控制、社交等维度标签;例如:性别、年龄、近30日访问次数、购买水平、经常活跃时间段等,有关用户标签体系建设的详细描述,见下文。
1.2 为什么需要用户画像
在大数据背景下,用户数据的来源很多,大多都是非结构化数据,无法直接用于分析和模型训练,也难以从中直接提取有用信息。然而,通过对行为数据进行标签化处理,我们能够更直观地了解用户。这样,计算机也能理解用户行为,从而在个性化推荐、搜索、精准广告投放和智能营销等领域发挥作用。
建立完善的用户画像体系对互联网产品具有重要的战略意义。通过用户画像,可以构建分析平台,用于产品定位、竞品分析和营收分析,为产品方向和决策提供数据支持和事实依据。在产品运营和优化中,用户画像帮助深入了解用户需求,从而设计出更符合用户的产品,提升用户体验。
二、建设标签和标签体系
用户画像的核心工作就是给用户打“标签”,构建用户画像的第一步就是搞清楚需要构建什么样的标签,而构建什么样的标签是由业务需求和数据的实际情况决定的。下面介绍构建用户画像的整体流程和一些常用的标签体系。
2.1 标签分类
标签可以通过多种方式分类,从实现规则来看,主要分为以下三种类型:统计类标签、规则类标签和机器学习挖掘类标签。
1.统计类标签
这是最基础且常见的标签类型。例如,用户的性别、年龄、城市、星座,以及近7日的活跃时长、活跃天数、活跃次数等信息,可以通过用户注册数据和访问、消费数据统计得出。这类标签构成了用户画像的基础。
2.规则类标签
这些标签基于用户行为、属性和预设规则生成。例如,“消费活跃”用户可以定义为“近30天交易次数≥2”。在实际开发中,运营人员和数据人员需要合作制定这些规则,因为运营人员熟悉业务,而数据人员熟悉数据的结构和特征。
3.机器学习挖掘类标签
通过机器学习技术,这些标签用于预测和判断用户的某些属性或行为。例如,根据用户的消费习惯判断对某商品的偏好。这类标签通过算法挖掘生成。
在项目工程实践中,统计类和规则类标签通常能够满足大部分应用需求,因此在开发中占据较大比例。机器学习挖掘类标签则多用于预测场景,如判断用户性别、购买偏好、流失意向等。由于机器学习标签的开发周期较长且成本较高,其开发比例相对较小。
最终的标签体系需要从用户视角出发,并结合具体业务进行定义。例如,在电商业务中,可以包括用户属性维度标签、用户行为维度标签、用户消费维度标签、和社交属性维度标签。
2.2 标签建设流程
下面展示了标签建设流程,侧重于产品经理的视角,主要描述需求分析过程和文档产出,同时简要总结标签的开发原理。
2.2.1 需求收集与分析
业务流程还原:了解用户的决策流程和业务场景,比如用户是如何在你的App中购物的。
商业目的明确:确定你希望通过标签体系达到的商业目的,比如提高投递/用户活跃。
运营策略设计:根据商业目的设计运营策略,比如通过推送优惠券来吸引用户。
2.2.2 产出标签需求文档
标签体系文档:详细描述每个标签的规则、使用场景等。
埋点确定:确定需要采集哪些数据来支持标签的生成,比如为了生成“消费活跃”标签,需要采集用户的交易数据。
数据需求文档:详细描述需要采集的数据,包括数据的上报时机、形式等。
2.2.3 标签的开发
ETL作业:提取(Extract)、转换(Transform)、加载(Load)数据,将原始数据加工成适合分析的格式。
用户画像主题建模:基于加工后的数据,进行二次建模,生成用户标签。
标签结果数据存储:将计算出的标签结果存储起来,供后续使用。
2.2.4 标签发布与效果追踪
标签应用:将生成的标签应用到实际业务中,比如精准营销。
效果追踪:监控标签的应用效果,比如通过标签进行的营销活动转化率如何。
模型优化:根据效果反馈,不断调整和优化标签体系。
2.2.5 实践建议
从简单开始:先从基础的统计类标签开始,逐步引入更复杂的规则类和机器学习类标签。
持续迭代:标签体系不是一成不变的,需要根据业务发展和市场变化不断调整。
跨部门合作:标签体系的建设需要数据团队、产品团队、市场团队等多个部门的合作。
三、用户画像产品化
用户画像产品化是指将用户画像的概念和数据转化为实际的、可操作的产品功能和应用场景,以实现商业增值。这一过程涵盖了数据的采集、处理、分析和应用等多个关键环节。以下是用户画像产品化的详细流程。
3.1 用户画像产品系统架构
用户画像产品化的系统架构通常包括四个主要层级,数据按照以下路径流动:
- 数据集成
- 客户端/服务端SDK:利用专门的软件开发工具包,从多种客户端(例如iOS、Android、微信小程序、网页等)收集用户的行为数据和属性信息。
- 导入:将已有数据导入系统,以便于进一步分析。
- 对接第三方应用:通过API接口与外部应用集成,丰富用户数据源。
- 数据接入
- Kafka:一种高效的分布式消息队列系统,用于接收海量数据流,并将其平稳地传输给下游处理系统。
- 数据整合/标签计算
- 数据仓库:用于大规模数据的存储和处理,包含用户属性和行为记录。
- ETL作业:执行数据的抽取、转换和加载任务,确保数据质量。
- 用户画像主题建模:基于业务需求对用户数据进行深度加工。
- 标签计算:根据预设规则计算用户标签,形成多维度的用户描述。
- 标签应用
- 前端画像展示:在界面中直观展示用户画像,便于业务人员理解和使用。
- API接入其他系统:通过开放API接口,将用户画像数据无缝集成至营销、推荐等系统中。
3.2 用户画像产品功能模块
- 系统看板:提供核心用户数据的概览,如总用户数、标签种类及数量等。
- 标签管理:支持业务团队对标签进行创建、删除、修改和查询等操作。
- 用户画像:展示特定用户的详细资料,涵盖属性和行为信息。
- 用户分群和用户群画像:通过组合多个标签定义目标用户群,并分析其特性。
- BI分析:与商业智能工具结合,实现更深入的数据洞察和比较。
- OpenAPI:确保用户画像数据与其他系统的同步更新,维持数据的一致性。
3.3 用户画像的应用场景
用户画像产品化后,可在以下领域发挥作用:
- 经营分析:运用用户画像数据评估流量、用户、商品、订单、渠道及产品表现。
- 精准营销:通过短信、电子邮件、推送通知等方式实施个性化营销活动。
- 个性化推荐与服务:基于用户画像提供定制化的内容推荐,增强用户满意度和忠诚度。
3.4 用户画像实践案例
以携程商旅用户画像为例,根据业务需求主要分为五大类标签,分别为基本属性、客户关系管理类标签、消费偏好类标签、风控类标签、实时类标签,下面列举一些常用标签。
- 基本属性
主要包括:公司ID、公司名称、所在城市、所属行业、注册时间、注册渠道、公司规模、公司类型等。 - CRM类标签
- 生命周期:活跃时长、沉默时长、是否新用户等。
- 业绩服务:退票率、投诉量、订单量、成交额等。
- 用户价值:会员等级、消费频率等。
- 偏好类标签
- 产品偏好:机票酒店占比等。
- 出行偏好:热门出发城市、到达城市、酒店星级偏好、飞机舱位偏好等。
- 增值服务:保险偏好等。
- 实时类标签
- 过去十分钟查询预订占比
- 过去十分钟页面浏览量
- 风控类标签
- 账户逾期金额
- 酒店入住城市离散度
- 历史逾期次数
- 信用评分
对比如下:
维度 | To B 用户画像(面向企业) | To C 用户画像(面向消费者) |
---|---|---|
用户构成 | 由公司(company_id)和用户(user_id)共同构成画像 | 以单个用户(user_id)为中心构成画像 |
需求明确性 | 高,商务出行需求明确 | 低,消费者选择多样,需求不明确 |
消费模式稳定性 | 高,企业业务稳定导致消费模式稳定 | 低,受个人经济状况、喜好等因素影响,消费模式多变 |
个性化意愿 | 弱,用户行为受公司政策影响 | 强,消费者根据自己的喜好和需求做出选择 |
行为信息互补性 | 同一公司下不同用户的行为信息可以互补 | 用户间行为相对独立,行为信息不互补 |
用户标识 | 一个user_id 对应一家 company_id(类似于牛客HR_ID) | 一个自然人可能对应多个user_id,需要自然人模型来唯一标识(牛客/知页) |
标签体系 | 包括公司维度和用户维度的画像,如公司规模、行业、用户职位等 | 侧重于个人维度的画像,如性别、年龄、兴趣爱好等 |
应用场景 | 反弊行为识别、产品个性化推荐排序、客户精细化运营管理等 | 个性化推荐、精准营销、用户体验优化等 |
携程toB用户画像:
每个企业客户可能有多个人使用携程商旅的服务,这些人可能是公司的员工、项目经理、行政人员等,他们代表公司进行预订、审批等操作。
这些代表人(用户)在携程商旅平台上的行为数据(如预订习惯、偏好、消费模式等)被收集和分析,以构建企业客户的整体用户画像。
携程商旅通过分析这些代表人(用户)的行为数据,可以更好地理解企业客户的需求和偏好,从而提供更个性化的服务和产品。
例如,携程商旅可以根据企业客户的预订数据,提供定制化的差旅政策建议、优化预订流程、提供专属优惠等。
携程商旅用户画像数据流转结构涉及数据收集、特征计算、标签建模、标签接口和数据监控等多个环节。以下是对携程商旅用户画像数据流转结构的总结:
-
数据收集:
●携程商旅用户画像数据主要来源于离线数据和线上实时埋点数据。
●离线数据存储在Hive数据仓库,包括业务数据、日志数据和其他BU共享的三方数据。
●实时埋点数据推送到Kafka集群,例如用户点击数据和浏览数据。 -
特征计算:
●特征计算是将数据仓库的数据清洗转换成特征的过程,为标签建模服务。
●数据清洗转换包括异常值处理、数据平滑归一、数据聚合统计、缺失值处理和数据校验等。
●离线数据处理借助Spark SQL完成,在线数据处理借助Flink完成。
●清洗转换后的数据流入特征库,供后续标签建模使用。 -
标签建模:
●标签建模采用基于业务规则转换、基于统计学建模和基于机器学习算法建模三种方法。
●基于业务规则的标签需要运营人员或需求方根据专业经验定义。
●基于统计学建模的标签根据统计学原理对窗口周期内的数据建模。
●基于机器学习算法建模的标签通过机器学习算法挖掘产生,如信用等级判定和消费金额预测。 -
标签接口:
●离线标签数据存储在Hive中,生产数据存储在MongoDB和Redis中以提高接口响应速度和服务可用性。 -
数据监控:
●数据流程监控调度主要借助Zeus数据管理平台和Grafana监控系统完成。
●监控贯穿数据生产消费的整个生命周期,报警方式包括邮件通知和IM通知等。
●监控内容包括数据源生产情况、任务调度失败、特征统计值、模型指标和接口响应时长等。
整个数据流转结构的设计旨在确保用户画像数据的准确性、实时性和可用性,以支持携程商旅的精细化运营和精准营销服务。
标签:数据,标签,行为,用户,建模,分享,画像 From: https://blog.csdn.net/weixin_43145550/article/details/143433866