Wesley13 Wesley13
3年前
CDH用户及开发者应当关注的CDP组件变化
在Cloudera和Hortonworks合并后,Cloudera公司推出了新一代的数据平台产品CDPDataCenter(以下简称为CDP),在2019年11月30日已经正式GA。CDP的版本号延续了之前CDH的版本号,从7.0开始,目前最新的版本号为7.0.3.0。那么CDP对比之前的ClouderaEnterpriseDataHub(
Stella981 Stella981
3年前
ClickHouse在字节跳动广告DMP&CDP的应用
展开function\_typeof(e){returne&&"undefined"!typeofSymbol&&e.constructorSymbol?"symbol":typeofe;}!function(e){if("object"("undefined"typeofmodule?
Stella981 Stella981
3年前
CDP对Azure ADLS云对象存储的访问控制
!(https://oscimg.oschina.net/oscnet/4dd6e6e397ab433f9384786cf4c0c3a6.jpg)CDPforAzure引入了使用ApacheRanger策略用于访问AzureDataLakeStorage的细粒度授权。Cloudera和Microsoft在该集成方面一直
京东云开发者 京东云开发者
10个月前
CDP技术系列(一):使用bitmap存储数十亿用户ID的标签或群体
一、背景介绍CDP系统中目前存在大量由用户ID集合组成的标签和群体,截止当前已有几千标签,群体2W。大量的标签都是亿级别数据量以上,例如性别、职业、学历等均,甚至有群体中的ID数量达到了数十亿。并且随着用户ID池的不断增加,标签和群体本身包含的ID数
京东云开发者 京东云开发者
10个月前
CDP技术系列(二):ClickHouse+Bitmap实现海量数据标签及群体组合计算
一、背景介绍上一篇文章介绍了CDP中,面对单个标签或群体数十亿的数据如何存储我们都知道数据仓库的概念,它的里边存储了我们所有的数据,其中就包含了标签或群体所依赖的数据,但是这些数据并不能直接拿来使用,想要变成业务需要的标签或群体数据,还需要进行加工。数据工
京东云开发者 京东云开发者
10个月前
CDP 技术系列(三):百万级 QPS 的人群命中服务接口性能优化指南
一、背景介绍CDP系统提供了强大的标签和群体的构建能力,面对海量数据的标签和群体,我们采用了BitmapClickHouse的存储与计算方案。详细内容可以参考之前文章。有了群体之后,它们被广泛的应用到支付,消金,财富,营销等各种核心业务的用户拉新,交易转
京东云开发者 京东云开发者
9个月前
营销系统黑名单优化:位图的应用解析 | 京东云技术团队
背景营销系统中,客户投诉是业务发展的一大阻碍,一般会过滤掉黑名单高风险账号,并配合频控策略,来减少客诉,进而增加营销效率,减少营销成本,提升营销质量。营销系统一般是通过大数据分析建模,在CDP(客户数据平台,以客户为核心,围绕数据融合、人群圈选、用户洞察等
【差分隐私】基本原理与入门级应用 | 京东云技术团队
差分隐私(DifferentialPrivacy,DP)是密码学中的一种手段,可以提高从统计数据库进行数据查询的准确性,同时帮助最大限度减少识别其具体记录的机会。DP一般分为:CDP(CentralizedDifferentialPrivacy)、LDP(
00后如何组织双十一大促看这一篇就够了! | 京东云技术团队
引言大家好,我是王蒙恩,一名“整顿职场”的00后。作为一名去年刚刚加入京东的校招生,我有幸成为本次CDP平台的11.11备战负责人。虽然早在实习的时候就经历过大促,但是真正组织整个部门的备战还是很难忘的。于是提起笔,给自己做一个大促总结,记录下11.11大