CTR点击率预估模型广泛应用于个性化推荐、信息检索、在线广告等领域,用来学习和预测用户的反馈,用户的反馈主要有点击、收藏、购买等。运用CTR点击率预估模型,我们能精细化地触达用户,提升触达渠道的使用效率。
业务app上就有许多的渠道,通过这些渠道每天我们都以不同的方式将各类信息曝光给用户。在我们的业务流程中常用的渠道就有:短信,微信,push,弹窗,站内信,banner等。
随着业务的开展,客户运营上的需求日益增多,大量各异的活动通过各个渠道触达用户,而过量的无效触达会降低用户体验,影响粘度和活跃。此外,热门渠道位供不应求,外部渠道更是存在流量和预算限制,急需更有效率地运用有限的的渠道资源。在这样的场景下,原本的人工规则匹配+白名单的方式在准确性和时效性上就有了明显的缺点。
我们提出的解决方案是建立综合渠道的CTR预测模型。运用我们的数据能力来准确地预测用户在某个渠道点击参与某个活动的概率,并以此系统化地统筹匹配用户,活动和渠道三方。相较于传统ctr模型以活动匹配用户的user2item建模处理流程,我们的方案实际是user2item 与 user2user 的结合。建模时除了活动的item属性,已响应人群和前期测试人群也作为种子用户,将他们的行为特征和业务特征入模,其思想方法类似于look-alike模型。而传统ctr模型中的user粒度在我们的方案中被替换为user*channel,加入了渠道的属性,强调用户在不同渠道上的响应差异与使用偏好。这样的方案设计通过对全渠道的ctr预测,实现了跨渠道,跨活动及跨用户的比较和筛选。
如图上所示模型使用了各匹配方中较为详尽的历史数据和设定特征
- 用户端:主要使用了业务数据来构建完整的用户画像,并通过用户行为数据反映用户的活跃度和app使用习惯
- 渠道端:用户在本渠道的历史点击反馈及历史触达情况
- 活动端:除了活动的设定属性,时效性,还包括前期测试人群及线上已响应人群的seeds-user特征
现在上线使用的是以构造特征通过boosting建模的线下t+1更新模式,为此也在数据平台上专门开辟了新的活动数据粒度。该方法作为冷启动的版本有较强的稳定性和可操作性。
有了一个活动在用户各渠道的点击概率准确预测,我们就能有效地定制用户的推送策略,通过最有效最无扰的方式触达每一个用户。例如,对于强干扰渠道,严格限制低概率的推送行为,减少无效打扰,提升用户体验。对于热门渠道,根据预测确定每个用户的推送活动优先级,将用户更感兴趣更易点击的活动优先推送。在项目效果上,通过我们的模型优化,弹窗端能成功减少无效打扰约35%,push端活动平均点击率相对提高约42%。
本文介绍了综合渠道点击预估模型的一些技术细节和特点,是目前在业务环节运用大数据技术能力的一个项目阶段成果。后续经过数据累计,可以继续在模型的深度和广度上做进一步的拓展,适应业务发展的新挑战。
本文来自信也科技拍黑米,经授权后发布,本文观点不代表信也智慧金融研究院立场,转载请联系原作者。