复杂度分析:如何分析、统计算法的执行效率和资源消耗
我们都知道,数据结构和算法本身解决的是“快”和“省”的问题,即如何让代码运行得更快,如何让代码更省存储空间。所以,执行效率是算法一个非常重要的考量指标。那如何来衡量你编写的算法代码的执行效率呢?这里就要用到我们今天要讲的内容:时间、空间复杂度分析。
Stella981 Stella981
3年前
Hive优化的十大方法
Hive用的好,才能从数据中挖掘出更多的信息来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。Hive在极大数据或者数据不平衡等情况下,表现往往一般,因此也出现了presto、sparksql等替代品。这里重点讲解hive的优化方式,例如优化分组:sethive.auto.convert.join
Wesley13 Wesley13
3年前
5行代码搞定14种常见图的python可视化库,还自带16种优美主题,真是太喜欢了
点击上方“Python爬虫与数据挖掘”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤醉卧沙场君莫笑,古来征战几人回?有时候我们做数据可视化并不需要特别复杂的功能,仅仅是想把简单的数据用图形展示出来今天就给大家介绍一种非常适合新手的python可视化库pygal!(h
Stella981 Stella981
3年前
Rsync数据同步应用指南
1.软件简介    Rsync是一个本地或远程数据同步工具,基于RSync算法,这个算法是澳大利亚人AndrewTridgell(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fspaces.msn.com%2Fwiki%2FAndrew_Tridgell)发
Easter79 Easter79
3年前
SQL Server 中日志的的作用(Redo和Undo)
简介   之前我已经写了一个关于SQLServer日志的简单系列文章。本篇文章会进一步挖掘日志背后的一些概念,原理以及作用。数据库的可靠性   在关系数据库系统中,我们需要数据库可靠,所谓的可靠就是当遇见如下两种情况之一时保证数据库的一致性:在系统崩溃/故障等情况下,保证数据库的一致性数据不能在多个DM
高并发海量数据爬取,哪种语言更适合?
今天我要和大家聊一聊一个让程序员们头疼不已的话题——高并发海量数据爬取。在这个信息爆炸的时代,我们需要从互联网上抓取大量的数据,便于进行分析、挖掘和应用。但是面对庞大的数据量和复杂的网络环境,我们应该选择哪种编程语言来完成这项任务呢?让我们一起来探讨一下吧
京东云开发者 京东云开发者
8个月前
通俗易懂关于Paxos的直观解释
一、Paxos是什么在分布式系统中保证多副本数据强一致性算法。没有paxos的一堆机器,叫做分布式有paxos协同的一堆机器,叫分布式系统这个世界上只有一种一致性算法,那就是Paxos…GoogleChubby的作者MikeBurrows其他一致性算法都可
京东云开发者 京东云开发者
3个月前
京东技术专家的修炼之道——成为一名“六边形战士”
近期受邀参加【中心成长加油站xUP技术人】的技术大咖直播活动,分享了我在京东工作近10年的经验与成长。2015年加入京东以来,我经历了后端架构、大数据、基础算法和业务算法等多个技术领域,获得了集团金项奖、最美京东人、集团算法大牛等多项荣誉,并发表了30余篇
大数据建模
大数据建模、分析、挖掘技术应用研修班的通知随着2015年9月国务院发布了《关于印发促进大数据发展行动纲要的通知》,各类型数据呈现出了指数级增长,数据成了每个组织的命脉。今天所产生的数据比过去几年所产生的数据大好几个数量级,企业有了能够轻松访问和分析数据以提高性能的新机会,如何从数据中获取价值显得尤为重要,也是大数据相关技术急需要解决的问题。大数据是需要新处理
从2PC和容错共识算法讨论zookeeper中的Create请求 | 京东云技术团队
最近在读《数据密集型应用系统设计》,其中谈到了zookeeper对容错共识算法的应用。这让我想到之前参考的zookeeper学习资料中,误将容错共识算法写成了2PC(两阶段提交协议),所以准备以此文对共识算法和2PC做梳理和区分,也希望它能帮助像我一样对这两者有误解的同学。