小研

  • 数据高效处理的秘诀——Kudu实战

    背景 使用Kudu之前,我们的Online Report采用都HDFS/Parquet on Impala的架构,数据每隔一小时通过MapReduce从生产db增量同步到HDFS,…

    2020年11月20日 654 0
  • Spark成长日记-从小白到通吃

    为什么选择Spark 随着业务的发展, 现行数仓的一些工作模式已经无法满足新的业务场景, 这些问题促使我们开始尝试使用一些新的技术和工具。 Apache Spark是专为大规模数据…

    2020年11月18日 487 0
  • 拒绝调包!且看MTCNN人脸检测推断过程详解!

    背景介绍: 人脸检测,解决两个问题:1)识别图片中有没有人脸?2)如果有,人脸在哪?因此,许多人脸应用(人脸识别、面向分析)的基础是人脸检测。 大多数人脸检测采用的流程为两阶段: …

    2020年11月17日 449 0
  • ALV模型在用户估值和信用决策中的应用

    ALV模型是什么,应用在哪? Account Level Valuation (ALV)模型,是广泛应用于美国银行业信用风险管理的一套模型,通过估计信用贷款在贷款周期内的价值,进行…

    2020年11月13日 480 0
  • 模型服务管理平台 – Waterdrop 之弹性伸缩

    前言 Waterdrop 是一个模型服务管理平台,它有以下功能: 自动服务化: 自动将模型代码封装为 API 服务 容器服务: 使用 Docker 镜像封装环境…

    2020年11月12日 510 0
  • Jaeger链路追踪全量采样初探

    应用背景 随着互联网公司业务多元化,复杂化,业务所依赖的服务逐渐进入分布式微服务时代,大大小小的微服务如雨后春笋般崛起,因此服务和服务之间的调用依赖则日趋复杂,而这些服务软件模块却…

    2020年11月6日 457 0
  • 精准触达丨综合渠道点击预估模型介绍

    CTR点击率预估模型广泛应用于个性化推荐、信息检索、在线广告等领域,用来学习和预测用户的反馈,用户的反馈主要有点击、收藏、购买等。运用CTR点击率预估模型,我们能精细化地触达用户,…

    2020年11月4日 551 0
  • 浅谈基于NLP技术的文本特征服务体系

    说起人工智能,你恐怕已经没有太大的好奇心了。谁都听说过深度学习,知道“AlphaGo战胜了李世乭”,甚至还有更早的“IBM Watson赢得了美国著名的Jeopardy答题秀”;每…

    2020年11月3日 511 0
  • 成交意愿度模型丨精准锁定目标客户

    背景介绍 企业的营销活动是通过发现或发掘准消费者群体的需求,让消费者了解产品进而购买该产品的过程 [1]。在我司的营销业务场景中,营销人员和智能对话机器人通过和用户电话沟…

    2020年11月2日 906 0
  • 数据标注丨AI技术背后的力量

    随着AI技术的发展,大量NLP问题得以解决。并且针对不同任务,有了与之对应的模型。然而,这些模型往往需要大量带标注的数据去训练,这导致在很多任务中模型变得难以使用。在项目中,由人工…

    2020年10月30日 699 0