导读:本文将介绍如何做多渠道预算分配,以及基于多渠道如何设计和分发权益,分享主要分为四个部分:业务背景业务建模业务应用工作展望 分享嘉宾黄文彬阿里巴巴高级算法工程师 编辑整理Faye 出品社区DataFun 01hr业务背景 众所周知,近些年随着人口红利带来的自然增长逐步放缓,各行各业逐步进入到增量价值挖掘。在这个阶段,智能化权益的营销策略会显得越来越重要,比如如何将预算在渠道以及时间维度去进行分配,以及以何种形式将权益发放给消费者,这是我们整体的业务背景以及需要去解决的问题。 我们的目标是在有限预算情况下,最大化全渠道用户支付转化率。 我们所面对的挑战主要有:多渠道场景,如何合理分配预算,全渠道收益最大;如何将具体的预算转换成与用户交互的优惠券收益最大;优惠券如何分发给用户使得整体收益最大。 02hr业务建模 1。业务建模整体方案 针对上述挑战,我们业务建模的整体方案如下图所示: 预算分配:当业务同学手头有一笔预算,想知道在什么时候、在什么渠道花多少钱才能使这笔钱花得最有价值。这就是预算分配所要解决的问题。主要基于渠道效能饱和度和预算分配建模这两块能力去做决策。权益设计:当决策在某渠道要投放一笔预算后,这些钱是不能直接发给用户的,我们需要一种权益的形式载体,如优惠券、红包、购物金等等。这里以优惠券为例,会用到渠道画像和权益画像,以及权益影响力去做决策。权益分配:权益设计完成后,就到了权益分配阶段。比如某个渠道的优惠券形式和张数都已确定,接下来面对的将是如何分发给用户使业务收益最大化的问题。将分两个阶段去解决,第一个阶段是决策是否要给某个用户发放优惠券,会基于用户意图识别和用户LTV预估来做决策;第二个阶段如果决定要发,发哪种优惠券,会基于用户权益敏感度来做出判断。数据监控:在发放优惠券之后,会有一个整体的监控,以便后续的模型迭代。 接下来将对预算分配、权益设计和权益分配展开来介绍。 2。预算分配 在何时以何种渠道花一笔预算才能获得最大收益,这是手头有预算的业务同学以及做营销算法的同学都非常关心的问题。 比如有A和B两个场景,我们会基于渠道效能饱和度做预算分配。渠道效能饱和度是定义渠道的营销价值空间,使各个业务渠道属性可以在同一个标准下进行比较。比如有多个渠道,A渠道主要的业务价值是拉新,B渠道的业务价值是拉订单或者拉GMV,它们在业务价值上是不对等的。我们要去做预算分配的时候,需要有统一的标准去做比较。 渠道效能饱和度借鉴于经济学里面非常经典的logit反馈函数,横坐标是成本投入,纵坐标是成本投入之后带来的收益。上图中以GMV预估为例,当成本投入为正向时,即给用户投放了成本,如降价或发放了优惠券,让利后GMV会有相应的提升;成本为负,比如价格抬升,那么GMV则会下降。这是某一个渠道的效能饱和度。 我们也可以用同样的公式刻画多个渠道。比如有A和B两个渠道去做投放,可以刻画两个渠道的曲线,然后是把渠道间的预算分配抽象为条件约束下的最优化问题,即最优理论求解。理想情况下是连续情况求解,即预算分配可以精确到分或元的细粒度,求解全渠道收益最大化,也就是一个非凸函数直接求解,这是比较困难的,所以我们可以使用对偶求解的方法。当然在现实中,很难将预算分配到一元两元,基本会在万的单位,也就变成了离散问题求解,我们可以使用分组背包求解。 3。权益设计 当确定了预算分配,那么预算应该以什么形式、门槛分发给用户呢?对于优惠券来说,如果门槛过高,用户购买时决策成本会提升;如果优惠券面额小,对用户的吸引力又不高。因此要制定合理的券门槛和券面额。 这时就需要定义权益影响力,优惠券在指定渠道上可覆盖人群范围,选取影响力最大的单券或券组进行优惠券设计决策。上图中的柱状图,横坐标是渠道用户客单价的分布,纵坐标是某一客单价下的人数占比,整个柱状图就是每个渠道下基于客单价的用户分布。可以看到分布在d区间的用户占比是最高的。假如d区间客单价是10元,那么我们设计一个10元的门槛是对整个用户群的覆盖最好的。 单券影响力公式如上图所示。其中,是用户客单价分布占比,为前向影响因子,为后向影响因子。比如按照d区间设置门槛,那么对于d区间人群影响力可能是100,而对于其它区间人群的影响力则会有衰减。影响力因子乘以用户占比,就是在一个客单价区间内的影响力。将每个区间的值累加起来,就是优惠券在这个渠道的影响力。 券组影响力,是多个优惠券影响力的集合。 4。权益分配 设计完权益之后,需要确认权益应该分发给哪些人,也就是权益分配。权益分配的目标是利用算法实现以人为中心的精准营销投放,最大化预算带来的业务收益。 有人曾说在广告上的投资有一半是无用的,但是我不知道具体是哪一半。我们希望对用户进行深度的刻画来衡量和预测在权益干预情况下带来增量价值。 如上图中,横坐标是不发优惠券用户是否会买,纵坐标是发优惠券用户是否会买。第一和第三象限的用户,无论发不发优惠券都不会改变其购买行为,我们就不希望给这部分用户发放优惠券。而第二象限用户是我们期望投放的用户。 我们所面临的关键挑战就是如何找到权益敏感人群。首先要决策是否发券,接下来是决策发何种券。决策发何种券的核心是权益敏感度建模Uplift增量模型。 Uplift模型用于预测某种干预对个体状态或行为的因果效应。如果不发放优惠券,自身购买的概率有50;如果给你发放了优惠券,你的购买概率有60,那么Uplift的收益就是10。 Uplift模型与Response模型的差异在于:Response模型:领取优惠券后发生购买行为的概率(相关性,无法区分权益敏感人群),比如上述例子中,Response模型学的是60这个值。Uplift模型:因为领取优惠券而发生购买行为的概率(因果性,精准定位权益敏感人群),比如上述例子中,Uplift模型学的是10这个值。 但Uplift遇到的挑战是,在现实中同一条件下不可能存在一个用户既有优惠券又没有优惠券的情况,也就是单个个体互斥行为是不可能存在的,在因果推断中叫反事实。虽然单个个体互斥行为无法获取,但是我们可以通过AB实验获取到一个群体的行为。比如将人群随机分成两部分,一部分投放优惠券,另一部分不投放优惠券,人群整体的行为上的差异,可以等效认为是单个个体的行为差异。这就是条件平均的因果效益。样本从AB实验中获取。 Uplift增益建模分为TwoModel和OneModel。TwoModel有两个模型,发优惠券和不发优惠券各一个模型去学习,之后相减得到增量价值。其优点在于原理简单、易于理解,可以直接套用现有模型。但是因为是双模型因此会有误差积累,并且因为非直接建模uplift,容易忽略微弱信号。OneModel与TwoModel最大区别是存在一个标签转换,只要训练一个模型就可以了。其优点包括直接套用现有模型,训练数据共享使得模型学习更充分,同时也避免了误差积累。但其本质仍是ResponseModel,对uplift建模是间接的。经过实际评估,OneModel的效果更优。 是否给一个用户发券,一是基于用户,另外也要基于库存。当库存不能覆盖全部用户时,就要去决策为哪些用户发券,这就是动态资源分配。我们最初期的模型是offline的,分组背包。后面迭代到了online模型,解决了线上实时情况与离线最优解存在差异、发放速率、使用实时特征的问题。 在总预算的约束下,实现业务目标的最大化,同样也是转化为对偶问题进行求解。 如果纯粹通过动态调控动态资源分配的话,有一个前提是认为所有用户的价值都是一样的,但是从业务视角来看,预算有限的情况下,希望把权益发给价值更高的用户,那么就涉及到了用户价值的预估。 我们会从几个维度考虑,首先会基于过去用户的行为去识别用户的购买意图。但在电商行业,用户的购买行为是比较稀疏的,会导致样本分布非常不均匀,此时需要做用户分层。比如基于用户购买行为去做识别之后,把用户的购买意图分成强中弱三层,对每一层去做用户的GMV的预测。然后再结合上述的预算分配、权益设计、权益动态分配。 以上就是对我们的整体方案的介绍。 03hr业务应用 上图是在一些落地场景,现阶段权益主要集中在优惠券。 04hr工作展望 我们未来的工作方向主要包括以下几方面:首先在预算分配方面,希望更精准地刻画渠道效能饱和度,以适应渠道多阶段的变化,比如在电商行业,在大促时间和平日,渠道的人群会发生很多变化,因此我们希望去做更加精准、也更兼容的刻画;另外也希望可以扩展应用渠道,量化多类权益渠道效能饱和度。另外在权益分配方面,现阶段主要集中在优惠券,后续会拓展到红包、购物金、积分等权益方式上,去做多类权益理解与分发。第三方面是去完善会员权益体系设计的搭建与管理。 最后,欢迎业内相关领域同学一起交流与分享。 今天的分享就到这里,谢谢大家。 分享嘉宾 黄文彬阿里巴巴高级算法工程师 2018年中国科学技术大学硕士研究生毕业,校招入职百度,2020年入职阿里巴巴,主要负责用户权益与会员体系、商品品质管控等相关的算法工作。 《数据智能知识地图》下载 上下滑动,查看《数据智能知识地图》用户画像模块。点击链接,快速查看《数据智能知识地图》介绍,并下载:Redirecting。。。 DataFun新媒体矩阵 关于DataFun 专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100线下和100线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号DataFunTalk累计生产原创文章900,百万阅读,16万精准粉丝。