小研
-
数据高效处理的秘诀——Kudu实战
背景 使用Kudu之前,我们的Online Report采用都HDFS/Parquet on Impala的架构,数据每隔一小时通过MapReduce从生产db增量同步到HDFS,…
-
Spark成长日记-从小白到通吃
为什么选择Spark 随着业务的发展, 现行数仓的一些工作模式已经无法满足新的业务场景, 这些问题促使我们开始尝试使用一些新的技术和工具。 Apache Spark是专为大规模数据…
-
拒绝调包!且看MTCNN人脸检测推断过程详解!
背景介绍: 人脸检测,解决两个问题:1)识别图片中有没有人脸?2)如果有,人脸在哪?因此,许多人脸应用(人脸识别、面向分析)的基础是人脸检测。 大多数人脸检测采用的流程为两阶段: …
-
ALV模型在用户估值和信用决策中的应用
ALV模型是什么,应用在哪? Account Level Valuation (ALV)模型,是广泛应用于美国银行业信用风险管理的一套模型,通过估计信用贷款在贷款周期内的价值,进行…
-
模型服务管理平台 – Waterdrop 之弹性伸缩
前言 Waterdrop 是一个模型服务管理平台,它有以下功能: 自动服务化: 自动将模型代码封装为 API 服务 容器服务: 使用 Docker 镜像封装环境…
-
Jaeger链路追踪全量采样初探
应用背景 随着互联网公司业务多元化,复杂化,业务所依赖的服务逐渐进入分布式微服务时代,大大小小的微服务如雨后春笋般崛起,因此服务和服务之间的调用依赖则日趋复杂,而这些服务软件模块却…
-
精准触达丨综合渠道点击预估模型介绍
CTR点击率预估模型广泛应用于个性化推荐、信息检索、在线广告等领域,用来学习和预测用户的反馈,用户的反馈主要有点击、收藏、购买等。运用CTR点击率预估模型,我们能精细化地触达用户,…
-
浅谈基于NLP技术的文本特征服务体系
说起人工智能,你恐怕已经没有太大的好奇心了。谁都听说过深度学习,知道“AlphaGo战胜了李世乭”,甚至还有更早的“IBM Watson赢得了美国著名的Jeopardy答题秀”;每…
-
成交意愿度模型丨精准锁定目标客户
背景介绍 企业的营销活动是通过发现或发掘准消费者群体的需求,让消费者了解产品进而购买该产品的过程 [1]。在我司的营销业务场景中,营销人员和智能对话机器人通过和用户电话沟…
-
数据标注丨AI技术背后的力量
随着AI技术的发展,大量NLP问题得以解决。并且针对不同任务,有了与之对应的模型。然而,这些模型往往需要大量带标注的数据去训练,这导致在很多任务中模型变得难以使用。在项目中,由人工…