Karen110 Karen110
3年前
plotnine: Python版的ggplot2作图库
R语言的ggplot2绘图能力超强,python虽有matplotlib,但是语法臃肿,使用复杂,入门极难,seaborn的出现稍微改善了matplotlib代码量问题,但是定制化程度依然需要借助matplotlib,使用难度依然很大。而且咱们经管专业学编程语言,一直有一个经久不衰的问题\“学数据分析,到底选择R还是Python”。通过plotnine这
黎明之道 黎明之道
3年前
python数据分析与可视化——时间序列数据分析
时间序列数据分析日期和时间数据类型datetime构造Python标准库中包含了用于日期(date)、时间(time)、日历(calendar)等功能的数据类型,主要会用到datetime、time、ca
Stella981 Stella981
3年前
Inflation 引起的 MetaSpace Full GC 问题排查|蚂蚁集团案例分析
1背景本文将用一个蚂蚁集团线上实际案例,分享我们是如何排查由于inflation引起的MetaSpaceFGC问题。蚂蚁集团的智能监控平台深度利用了Spark的能力进行多维度数据聚合,Spark由于其高效、易用、分布式的能力在大数据处理中十分受欢迎。关于智能监控的计算能力相关介绍,可以参考
Wesley13 Wesley13
3年前
1.3什么是组合特征?如何处理高维组合特征?
03高维组合特征的处理知识点组合特征问题什么是组合特征?如何处理高维组合特征?分析与解答为了提高复杂关系的拟合能力,在特征工程中经常会把一阶离散特征两两组合,构成高阶组合特征。以广告点击预估问题为例,原始数据有语言和类型两种离散特征,表1.
Wesley13 Wesley13
3年前
APP数据分析,到底是在分析什么?
当下,逢运营必谈数据分析,APP运营更是如此。数据分析的用意本不在于数据本身,而是要打造一个数据反馈闭环。收集数据,设计基础数据指标,多维度交叉分析不同指标,以数据甄别问题,再反向作用产品,最终形成数据驱动产品设计的闭环。从运营小白到产品经理,提到APP数据分析,必谈DAU、MAU、留存率、频率、时长…..那么,究竟如何将这些数据分析和日常运营结合起来呢
天翼云通过DCMM 4级认证
近日,中国电子信息行业联合会(简称“CFEII”)公布了2022年第二批获得DCMM(数据管理能力成熟度)等级证书的企业名单,天翼云科技有限公司获评DCMM4级,数据管理能力达到量化管理水平。数字经济时代,数据已成为关键生产要素。2021年11月,工业和信息化部发布《“十四五”大数据产业发展规划》,进一步强调了数据要素价值,明确提出“要完善数据管理能力评估
面向大规模分析的多源对地观测时空立方体
随着对地立体观测体系的建立,遥感大数据不断累积。传统基于文件、景/幅式的影像组织方式,时空基准不够统一,集中式存储不利于大规模并行分析。对地观测大数据分析仍缺乏一套统一的数据模型与基础设施理论。近年来,数据立方体的研究为对地观测领域大数据分析基础设施提供了前景。基于统一的分析就绪型多维数据模型和集成对地观测数据分析功能,可构建一个基于数据立方的对地观测大数据
京东云开发者 京东云开发者
8个月前
京东零售数据资产能力升级与实践
开篇京东自营和商家自运营模式,以及伴随的多种运营视角、多种组合计算、多种销售属性等数据维度,相较于行业同等量级,数据处理的难度与复杂度都显著增加。如何从海量的数据模型与数据指标中提升检索数据的效率,降低数据存算的成本,提供更可信的数据内容和多种应用模式快速
开源数据库生态遇新变数,天翼云TeleDB提供企业数据管理更优解!
天翼云TeleDB分析型实例是一款性能卓越、完全托管的PB级国产化云分析型数据库产品,可提供轻松的海量数据分析体验。基于元数据、计算和存储分离的架构,TeleDB分析型实例集成了MPP数据库的高性能和分析功能、大数据平台的扩展性和灵活性以及云计算的弹性和敏捷性,支持SQL及标准的JDBC和ODBC接口,允许使用自定义函数及内建机器学习功能。