凤凰广告投放

OCPC 广告算法在凤凰新媒体的实践探索(上)

发表时间:2023-04-08 10:00
OCPC广告算法在凤凰网广告平台的实践探索

导读:广告算法在优化点击率和竞价机制等提升平台收益的过程中,如果不能保证广告主转化的质和量就会影响到平台生态的稳定发展,因此在 CPC 的基础上,我们探索了 OCPC 模式,并在实际中成功应用。

OCPC广告算法在凤凰新媒体的实践探索,主要内容包括:

▌背景介绍

1. 凤羽简介

01.png


凤羽是凤凰卫视程序化广告变现优质品质曝光平台,汇聚了凤凰网、手机凤凰网、凤凰新闻客户端、凤凰视频客户端等多项业务,每天为凤凰网提供20亿次优质流量的曝光。

2. 什么是 OCPC

02.png

OCPC 是效果广告最近两年比较好的业务模式,广告主关心的还是成本 ROI,同时能跑量。

CPC 按点击付费,广告主基本都接受这种付费方式。本质上,广告主会根据凤羽的 CPC 消耗,核算他的转化成本。所以广告主为了优化这个成本,他可能调低 CPC,但是抢不到量;选择做人群、时间定向,基于经验论或者数据反馈;或者跑人群包等等。

相比传统的 CPC 业务效果广告,OCPC 本质上,是通过算法把优化工作替广告主做了。而且由于有更好的手段,所以效果更好。OCPC 还是按照点击付费,但是 OCPC 一般情况下,客户不再出点击价,出的是目标成本价 CPA。OCPC 一般分第一阶段和第二阶段。第一阶段用于数据的冷启动,第二阶段用于积累数据。

3. 定义问题

03.png

CPA 有两个目标:

目标1:转化率上升,转化成本下降, ECPM 上升,从而提高客户转化率。

目标2:成本稳定,消耗稳定,从竞价机制上提出优化点。

04.png

相对应的,我们的目标是在客户指定成本的情况下,每天相对稳定的跑量。

我们提出了三种优化手段:

  • 二价机制,二价机制指的是出价格抢这次的流量,只需支付第二名的价格。

  • 智能出价,相比二价机制的自然分配,智能出价是一种流量的更积极分配。会根据目标,进行智能的出价操作。

  • CVR ( 转化率 ) 预估,CVR 预估是整个阶段的基础,问题是 CVR 预估的样本非常稀少,需要做到多准确?

CVR 预估

05.png

由于在数据非常稀少的时候,很难做出准确和泛化的 CVR 预估,而 OCPC 可以完成。因为我们用到了二价机制,抢到的流量是第二名的价格,不过只要 CVR 的偏差可控,比如小于二价的 Gap,也能获得不错的成本控制。第二层面是 CVR 预估虽然有不准的成分,但我们可以通过智能出价来做经验控制,比如拿转化率高的部分,也可以把成本降下,从这个角度分析,CVR 预估不用特别准确。

06.png

关于 CVR 数据稀疏的问题。新的客户在冷启动阶段的转化不到100个,使用不到100个的转化建立用户的转化率的预估,这个问题是比较困难的。其次,点击转化率与曝光转化率其实不一致,这是一个漏斗序列,先曝光再点击再转化。

如果用点击行为样本训练模型行预估点击转化率,在线上会出现数据不一致的情况,在数据样本比较小的时候,会有很大偏差。曝光转化率解决了样本不一致的问题,但是考虑到数据稀疏,建模后偏差过大,这种方法被弃用。

做过数据分析,发现点击率与转化率存在相关性,可以考虑将 CTR 与 CVR 一起联合训练联合建模,它们肯定有很多特征信息可以共用的。比如通过 weightedLR 做 loss 改造,在推荐等其它项目中有过不错的效果,后续可以一试。

最后,是构建一个模型还是多个模型?是分一个客户建模还是考虑同行业同目标一起建模?关键还是在于业务目标和数据情况:

OCPC 追求单个客户的完成率,要为单个客户做 ROI 达成和算法归因,同时各个客户之间的差异很大,这和全局最优化不一样。从这个角度出发,在考虑很多方法之后,决定为每个客户单独建模。所以会有很多模型,有很多工程上的版本控制,会考虑泛化与工程准确度的需求,我们会为相似的用户做一些先验的平滑,来提升准确度。后续 OCPC 的客户非常多的时候,可以考虑同一个行业,同一转化目标的类型一起建模,数据的稀少情况也能得到一定缓解。

07.png

我们目前的 CVR 预估的方法,借鉴 yahoo 的论文,采用一种在线学习的基于特征子空间的 bayes 平滑算法,并融合试探、分裂策略。步骤分为以下五步:

① GBDT 训练得到若干颗树,形成多种特征子空间 ( tree );

② 不同广告采用自己样本驱动每个子空间 ( tree ),计算 CVR ( beta 分布 ),判断置信度;

③ 在线学习:进行 CPC 模式的退化;

④ 在线学习:分裂子空间和试探子空间;

⑤ 相似广告会做贝叶斯平滑,提升准确度提升泛化性能。

08.png

下面是关于算法的一些细节,简单的说用 GDBT 对样本和特征做随机采样,然后用随机采样出来的多对异构的多棵树,从里面提炼出各个特征子空间,然后对这些特征子空间,每一个广告、每一个客户,我会单独用自己样本探索这些特征子空间,在里面做置信度判断、CVR 预估、试探、分裂策略,来保证 CVR 的准确性和泛化性能。整个算法在实现的过程中还是存在一些问题的,大概列出了以下几个问题:

① 为什么不采用 GBDT 的预估?

希望通过在线学习和置信度控制,来得到一个可以业务进化的有效模型和策略;但是,GBDT 仍然是一个有效的预估,可以考虑结合;

② GDBT 如何构建树?选多少颗树?

原生办法利用 LightGBM 特征的采样,第二种方法是人工做交叉,去选取特征,在实践中应该选多少棵树,也是看具体业务情况。我们的经验是一般用16颗树。

③ 如何多颗树的多个子空间给出的 CVR,组合出新的 CVR?有以下的几种做法:

-> 取平均值。

-> 参考每个子空间 CVR 的方差,给出加权平均 ( yahoo )。

-> 参考每个子空间 CVR 的方差,子空间颗粒度做加权平均,子颗粒太大,方差就大,偏差也会大。

-> 取 CVR 的最大和最小,最大值不推荐,训练模型是右偏的,本来是高估的,用最大值高估现象更严重,会高估用户成本,最小值想对安全,但是最小值可能跑不出量。

在后续的实践中,我们发现做 LR 集成还是一个更通用的模式。精度会高一些,同时可以将多个相似客户一起建模,提升一定的泛化能力,也减少了模型数量。

④ 多颗树中,有的子空间置信,有的不置信,如何选择试探、退化等策略?

-> 冷启动阶段数据太少,要退化到 CPC 模型,平滑了 OCPC 的第一阶段和第二阶段;

-> 相似广告的子空间数据要做贝叶斯平滑,做 MLE 求解;

-> 试探策略,计算置信上界,乐观估计,促使拿量;用置信上界。系统中有一个试探系数来控制。实践来看,当采用适当的试探系数时候,客户的成本和平台的 ECPM 能有一个双赢。所以这个试探系数可以作为一个策略学习部分后续优化。

更多关于凤凰网广告平台的介绍详情官网咨询!

09.png

可以通过在线学习,进行快速试探。在线学习的一个很大的优点是可以提升准确度:

一开始样本特别稀少,CVR 预估 bias 很大,需要快速学习分裂,找到更置信更细化的子空间。另外,当竞价环境出现变化的时候,CVR 预估的偏差会大大增加,导致 OCPC 失败,比如在节假日。

比如,在正常情况下,可以拿到左边完整的特征分布的流量。但是当竞价变得激烈之后,同样的模型和策略,我只能拿到转化率很低的那部分流量,实际 CVR 的偏差就会很大。这是很失败的一个案例,在线学习能大大提高 CVR 的准确度。

010.png

试探策略可以加快业务进化和 CVR 收敛。基于试探策略,将流量分配给不置信的子空间。它有两点好处,如下:

① 节省 OCPC 的试探弹药。将预算更多投放给可能有高转化率的子空间;能加快 CVR 预估的收敛速度,业务快速进化到第二阶段;

② 试探有一个刷新人群的效果;偏向于给新人群。

同时,实践中发现,试探能做为一个有效的策略,来影响最终的多目标达成,所以还是一个很好的智能调价 strategy。

011.png

试探策略我们采用的是推荐常用的 UCB,为了避免样本过少,所有做了平滑,取威尔逊的置信上界。这样如果特征空间不置信,我们倾向于给它足够多的试探,就可以让客户第一阶段能更快的收敛。实际中,如果直接用置信上界去试探,由于太高的 CVR 值,可能出现跑量太快的异常情况。所以 CVR 预估值也不能太高,需要做一个上界的约束。

012.png

在线学习有一个很明显的问题,转化其实是有很强的样本的延迟,不同的转化目标,不同商品,他的转化周期不一样。比如说 app 的下载转化是很快的,app 的激活可能要延迟好几天,我们在做在线学习的时候需要快速收敛,我们会以小时为单位对数据进行校验,然后开始做实时的返回学习。但是我们会对历史数据做指数平滑,同时我们会每一天、每两天、每三天为窗口的这段时间的数据重新,再重新做下全天的求证,样本延迟带来的偏差。

同时可以求解客户转化的概率的延迟分布,针对一个小时内的样本做权重上的求证。样本延迟还会带来一个问题,就是转化归因的问题,把转化归因到某一次点击上。比如三天某一个用户点击了广告并下载了 app,但是今天才实行了激活,这样的激活的转化是应该归因于三天前的点击,还是现在这一次的点击,这其实也需要自己取舍。




行业信息
广告投放
 
 

18971576794

凤凰渠道活码.png

免费开户中


需求提交>>