Stella981 Stella981
3年前
Redis 的落地策略
因为之前使用redis一般都只做热数据处理,没有考虑过落地方案,因此,通过很多次不同的交流,发现落地也挺重要的,特来学习一般。落地策略我们知道,redis是纯内存数据库,一旦发生宕机,数据就会丢失,因此,Redis的落地策略其实就是持久化(Persistence),主要有以下2种策略:1.RDB:定时快照方式(snapsho
Stella981 Stella981
3年前
Kafka到底有几个Offset?——Kafka核心之偏移量机制
!(https://oscimg.oschina.net/oscnet/3ea57a5cd288c6bbc24521607f4e0aae21a.jpg)    Kafka是由LinkIn开源的实时数据处理框架,目前已经更新到2.3版本。不同于一般的消息中间件,Kafka通过数据持久化和磁盘读写获得了极高的吞吐量,并可以不依赖Storm,SparkSt
混世魔王 混世魔王
1年前
我用皕杰报表的一点体会
算起来大概六七年前就接触了皕杰报表,那时我在公司信息部做数据处理小组的负责人,以前我们整理数据的方式,还是用传统的人工通过Excel整理,花费了很多时间做报表。但时效性和正确性都无法保障,做出来的报表几乎没用,根本没法支撑公司经营决策的需求。后来企业开始做
Python进阶者 Python进阶者
1年前
Python自动化办公之PDF版本发票识别并提取关键信息实战教程(上篇)
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公发票数据处理的问题,一起来看看吧。二、实现过程这个问题在实际工作中还是非常常见的,实用性和通用性都比较强,历史文章中其实也有写过几篇文章,这里继续给大家敲敲
Python进阶者 Python进阶者
1年前
如何把某一列中包含某个值的所在行给删除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据处理的问题,一起来看看吧。大佬们,如何把某一列中包含某个值的所在行给删除?比方说把包含电力这两个字的行给删除。这里【FANG.J】指出:数据不多的话,可以在exc
京东零售数据资产能力升级与实践
开篇京东自营和商家自运营模式,以及伴随的多种运营视角、多种组合计算、多种销售属性等数据维度,相较于行业同等量级,数据处理的难度与复杂度都显著增加。如何从海量的数据模型与数据指标中提升检索数据的效率,降低数据存算的成本,提供更可信的数据内容和多种应用模式快速
京东云开发者 京东云开发者
2个月前
云电脑:快速部署无限制、可联网、带专属知识库的私人 DeepSeek 大数据模型
作者:京东云李凯在当下的科技领域,DeepSeek无疑是一颗耀眼的明星,近期关于它的话题热度持续飙升,引发了无数技术爱好者和行业从业者的热烈讨论。大家纷纷被其强大的大数据处理能力和广泛的应用前景所吸引,急切地想要深入探索和使用这一先进的模型。然而,当人们满
京东云开发者 京东云开发者
1个月前
京东零售数据资产能力升级与实践
作者:京东零售韩雷钧开篇京东自营和商家自运营模式,以及伴随的多种运营视角、多种组合计算、多种销售属性等数据维度,相较于行业同等量级,数据处理的难度与复杂度都显著增加。如何从海量的数据模型与数据指标中提升检索数据的效率,降低数据存算的成本,提供更可信的数据内
高效时代,谁是DeepSeek部署的“最优解”?
在当今数字化浪潮中,随着文字、图像、音频、视频等多元数据处理需求不断涌现,大语言模型已成为推动行业智能化的关键力量。DeepSeek作为一款先进的大语言模型,能够轻松应对从基础问答到复杂数据分析的多种任务,为各行业带来前所未有的智能化体验,但同时也对底层云
大数据建模、分析、挖掘技术应用
时间2022年8月5日—2022年8月9日北京(同时转线上直播)(5日报到,6日9日上课)课程第一天一、大数据概述二、大数据处理架构Hadoop三、分布式文件系统HDFS四、分布式数据库HBase第二天五、MapReduce六、Spark七、IPythonNotebook运行PythonSpark程序八、PythonSpark集成开发环境第三