为什么需要用户画像 如果你是用户,当你使用抖音、今日头条的时候,如果平台推荐给你的内容都是你感兴趣的,能够为你节省大量搜索内容的时间。 如果你是商家,当你投放广告的时候,如果平台推送的用户都是你的潜在买家,能够使你花更少的钱,带来更大的收益。 这两者背后都有一项共同的技术支撑着,那就是:用户画像。本文将会从用户画像的基本概念、使用场景、构建流程和技术,为你揭秘构建用户画像的全流程。 什么是用户画像 用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像就是与该用户相关联的数据的可视化的展现,即用户信息标签化。 用户画像可以理解成是海量数据的标签,根据用户的目标、行为和观点的差异,将他们区分为不同的类型,然后从每种类中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,形成了一个人物原型(personas)。 常见的用户画像中的属性包含:人口属性、会员属性、行为属性、交易属性、消费属性。 构建用户画像数据之后,可以从各个维度、为各个行业提供个性化推荐、精准营销、智能风控等数据应用开发。 用户画像的使用场景 可以从宏观和微观两个层面来描述用户画像的使用场景。宏观层面:构建具象认知以及战略、战术方向探索用户足迹、市场细分与用户分群,并以其为市场导向微观层面:勾画用户,联系用户需求与产品设计,便于解构场景内用户。各类数据应用:作为推荐搜索风控等重要一环而存在。定性和定量化方法结合的载体,数据化运营和用户分析。精准营销和定向投放,使产品的服务对象更加聚焦、更加专注。 用户画像常见的应用主要是四种场景: 用户特征洞察: 辅助用户分析和用户洞察,用户标签可以帮助业务人员快速的对用户有一个认知,然后发现里面显著的特征,获得一些商业灵感。 增强数据分析: 标签还可以丰富数据的维度。对我们的业务数据,有更深层次的对比分析,而分析洞察得到的灵感以后,可以辅助业务落地。 精细化运营: 一方面,可以将用户群体,切割成更细粒度的群组,使得运营从粗放化到精细化,用多种不同的手段,不同的渠道去触达,比如说短信、推送、邮件等等,对于用户进行驱动或召回,从而达到事半功倍的效果。 数据产品应用: 另一方面,除了驱动人工的业务以外,用户标签还可以成为其他数据产品的基础,比如个性化推荐系统,广告系统,CRM等这些系统。自动化的业务系统能更有效的利用这些用户标签,从而发挥更巨大的威力。 用户画像的构建流程 用户画像的构建,可以分为项目启动、标签发布、标签收敛、数据集成、标签拓展、用户理解、标签挖掘等过程。 项目启动阶段:确定用户画像构建的目标和使用场景。 划分标签发布阶段:设计和划分用户画像的标签,确定用户标签的计算逻辑、开发和上线的范围和迭代节奏。 标签收敛阶段:收敛标签的覆盖范围,划分出标签的重要等级和可信程度。 数据集成阶段:集成用户行为数据接入系统,计算加工成用户标签,并与用户画像服务集成。 应用拓展阶段:将固化下来的用户画像标签应用到更加广泛的应用中。 用户理解阶段:将不同应用中的用户画像标签的使用结果进行汇总,评价用户在不同应用中的使用偏好,细化对用户的画像的刻画,增强对用户的理解。 标签挖掘等过程:挖掘和扩展现有的用户标签体系。 用户画像的构建流程需要闭环,在挖掘和满足业务需求、基础数据的收集和计算、构建和完善用户画像之间迭代完善。 用户画像构建流程 在构建用户画像,设计和开发用户画像标签的过程,可以参考上图划分的步骤来开展。 用户画像构建成功之后,需要责任到人,迭代优化。 构建用户画像的技术与方法 在构建用户画像的过程中,使用分层的思想,借助平台和大数据技术接入和分析数据。上图描述了一个用户画像系统的全貌。 1。基础设施: 大数据基础设施,只是数据接入、存储、计算以及查询。实时数据处理:通常选用KafkaFlink对象存储的技术。离线数据处理:通常选用SparkHiveon对象存储的技术。 2。数据层 包括实时流、离线统一数据、第三方数据。这里说一下离线统一数据: 以前更关注的是离线数据,但是当APP越来越多以后,各个端的离线数据口径和埋点是不一致的,有非常大的挑战,特别对于成熟的公司做用户画像时,会发现这一块最耗费精力,因为要对所有的数据口径进行梳理。所以这块未来希望有一套统一的离线数据来支持上层整体的用户画像应用。 3。用户理解层 在数据层上面,再会构建自己的用户理解层,基于数据去理解用户。主要包括行为和标签。行为:因为有些行为是有强意图的,我们希望把强意图的行为也能够直接积累起来,并在上游直接应用。行为主要包括实时session行为和关键行为。实时session行为:基于session可以挖掘到上游更多的意图,还可以基于session进行线上调整,应用于精细化运营和推荐等。关键行为:需要累积好,对上游的应用或者精细化运营有非常大的应用场景。有业务需要调用时,可以直接复用这种关键行为。基于这种行为以后,我们才会去挖掘标签体系或者挖掘用户画像。标签:对于标签,主要包含了4类:事实标签:一些更偏事实类的标签,比如用户是什么等级的用户规则标签:就是通过一定的规则计算出来的标签模型标签和实时标签:通过模型挖掘的标签,以及可能服务于具体业务的实时标签。 4。服务层 在用户理解的基础上,我们可以提供各种服务:统一用户画像服务、标签管理(用标签元信息来管理标签)、用户理解平台(主要面向算法工程师和分析师,用于监控标签的质量,调优标签的结果)。 5。应用层 各种用户画像和用户画像标签的具体应用。 上述的用户理解层,主要由产品经理、算法工程师牵头,用各种方法、算法完善用户标签体系和标签准确度。 上述的服务层,可以通过抽象出一个标签工厂,将用用户标签的管理和开发抽象出一个独立的项目,跨部门协作,进行开发、管理、质量监控和优化。 总结 本文从用户画像的基础概念出来,介绍了用户画像的使用场景、建设流程、涉及的技术以及如何迭代完善,描述了一个完整的构建用户画像系统的过程。用户画像系统的建设是一个庞大的跨团队项目,需要市场、运营、产品、大数据、算法各个团队的通力协作才能完成的项目。搭建好用户画像系统之后,需要验证用户标签的正确性并需要迭代完善。 相关文章导读 指标体系相关搭建指标体系的实施过程大数据团队实践分享(https:www。toutiao。comarticle7194229231637840445)如何搭建指标体系?OSMARGO金字塔原理(https:www。toutiao。comarticle7193851943209452070)基于开源可视化数据探索平台Superset的指标体系建设(https:www。toutiao。comarticle7157336903145357824) 数据架构相关云上流批一体架构设计与实践大数据团队实践分享(https:www。toutiao。comarticle7195709449506472487) 数据治理相关数据管理成熟度模型DataManagementMaturityModel(https:www。toutiao。comarticle7133058428549464606)数据质量成熟度评分卡数据管理成熟度模型系列(https:www。toutiao。comarticle7133831970345370127) 数据仓库相关数据仓库7种缓慢变化维的处理方法(https:www。toutiao。comarticle7201281170535924257?logfromf8eb8b86ffc151676762298413) 开源技术相关手把手教你源码安装DolphinScheduler作业调度系统(https:www。toutiao。comarticle7143945605298192935)DolphinScheduler:从Shell工作流说到代码解析任务间的依赖关系(https:www。toutiao。comarticle7145296029645193765)手把手教你源码安装DataEase开源数据可视化分析工具(https:www。toutiao。comarticle7144529676512281129)