小慧
-
冷热数据分离技术琐话
引言 大数据集群存储着各种不同类型的数据集,不同团队共享地在集群上面处理不同类型的计算任务。业务的不断增长和新的应用接入,每个数据集通过这些相同或不同的数据管道不断增长。数据的持续…
-
基于微信机器人实现ChatOps的探索
引言 本文将分两部分,主要讨论微信机器人的实现与适用性以及在此基础上的ChatOps可行性探索。 微信机器人的技术实现与适用性 实现微信机器人的方式有很多,目前开源的微信机器人也不…
-
基于滑动窗口的实时同步架构简介
背景 随着业务场景的不断丰富,基于T+1天的数据决策显得捉襟见肘,而深度分析与挖掘的实时性要求也越来越强烈。当数据规模较小时,使用事务性数据库(Oracle, Mysql)进行数据…
-
深度学习在篇章级文本分类中的应用
文本分类是NLP领域最经典同时也是最基础的应用场景之一,有很多种方法可以实现这个任务。我们常见的是对句子进行分类,而篇章级别的分类则会更复杂一点。常见的篇章级别分类有针对文档或文章…
-
埋点浅析丨用户行为事件晴雨表
这不是一篇纯技术文章,仅仅是个人对埋点经验的分享,希望通过浅显易懂的说明,让非技术的伙伴能快速了解这些埋点概念。 埋点是什么 在业务逻辑中嵌入数据采集代码的过程,就是“埋点”。它是…
-
风险模型中两个有趣的问题
风险控制恒久以来就是金融服务中非常关键的环节,随着移动互联网和消费互联网的发展,金融的业态发生了变化,需要越来越多地关注线上的用户体验,需要提高服务流程的效率,更加自动化和实时化的…
-
风险系统中模型调度那些事
随着业务的发展,拍拍贷风控系统中的模型调用链中的模型数量以及模型之间的依赖关系也出现了上升的趋势。如何解决模型之间的调用顺序,并优化整体调用时效成了拍拍贷风控系统中模型调度模块所面…
-
浅谈基于NLP技术的文本特征服务体系
说起人工智能,你恐怕已经没有太大的好奇心了。谁都听说过深度学习,知道“AlphaGo战胜了李世乭”,甚至还有更早的“IBM Watson赢得了美国著名的Jeopardy答题秀”;每…
-
语速模型丨解码语速背后的秘密
语速模型的应用背景 语速,顾名思义,描述的是一个人的说话速度。量化的表示,就是一个人一分钟内说话的字数。一个人平均说话语速是100-200字每分钟,正常语速在每分钟150字左右。 …
-
竞争蓝海泛红 科技赋能消费金融应张弛有度
近年来,金融科技大跨度进步,消费金融领域迎来井喷式发展。不过,入局者逐渐增多之下,竞争也呈现蓝海泛红态势,消费金融该如何应对挑战和抓住同业合作机会? 日前,在证券时报举办的“201…