个推分享Spark性能调优指南:性能提升60%↑ 成本降低50%↓
前言Spark是目前主流的大数据计算引擎,功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作,应用范围与前景非常广泛。作为一种内存计算框架,Spark运算速度快,并能够满足UDF、大小表Join、多路输出等多样化的数据计算和处理需求。作为国内专业的数据智能服务商,个推从早期的1.3版本便引入Spark,
Stella981 Stella981
4年前
Spring Cloud + Redis 是如何实现点赞、取消点赞的?
文章结尾有彩蛋一、Redis缓存设计及实现1.1Redis安装及运行1.2Redis与SpringBoot项目的整合1.3Redis的数据结构类型1.4点赞数据在Re
Wesley13 Wesley13
4年前
Java内存管理
勿在流沙筑高台,出来混迟早要还的。做一个积极的人编码、改bug、提升自己我有一个乐园,面向编程,春暖花开!作为Java程序员,Java的数据类型这个是一定要知道的!但是不管是那种数据类型最终存储都要到内存中,本文由浅入深对数据类型进行介绍和讲解,相信读完本文你一定会有收获的,会对Java数据类型有更深的了解和认识!
Wesley13 Wesley13
4年前
MySQL创建索引
创建索引方法一:创建表时  CREATETABLE表名(字段名1数据类型完整性约束条件…,字段名2数据类型完整性约束条件…,UNIQUE|FULLTEXT|
Stella981 Stella981
4年前
PAP 快速开发框架:mybatis
  背景:在使用mybatis的过程中,考虑到整合的框架在后期使用的过程中,有可能是需要兼容到多种数据库的,在这种前提条件下,完成通用CRUD功能的编写,本文前期先考虑到不同数据库针对分页功能的统一操作;例如mysql数据库的分页是limit关键字的使用,oracle数据库的分页是rownum关键字的使用;  demogit地址部分: h
Stella981 Stella981
4年前
58怎么玩数据库架构(upyun架构与运维大会速记)
大家好,我是58沈剑,今天我分享的主题是《58怎么玩数据库架构》,我的PPT页数非常少,讨论的问题非常的聚焦。一、数据库的基本概念基本概念就一页PPT,让大家就一些数据库方面的概念达成一致。首先是“单库”,最开始的时候数据库都是这么玩的,几乎所有公司都会经历这个阶段。接下来是“分片”,也就是
Wesley13 Wesley13
4年前
MongoDB分片介绍
本文简单介绍MongoDB的分片功能,对分片进行了概述,具体的功能详解,后续文章会陆续推出分片是把数据分配到多个服务器上的一种方式,MongoDB使用分片实现大数据部署以及高吞吐操作。大数据以及高吞吐量的应用会对单个服务器的容量造成很大的挑战。比如,高频率的查询操作会消耗服务器的CPU,如果数据集大于系统的RAM容量,也会对硬盘的性能造成影响。应
Wesley13 Wesley13
4年前
2016中国数据库技术大会(DTCC 北京)
大会介绍随着大数据影响力的不断扩张以及其相关技术的深入发展,大数据从互联网领域向其他行业急速蔓延,行业、金融、政府等领域爆发大数据风潮,大数据对传统行业的影响越来越深重。2015年,国务院常务会议通过了《“互联网”行动指导意见》,明确推进“互联网”促进协同制造、现代农业等11个重点领域,以“互联网”深度改造传统行业,数字驱动转型,促进产业跨
Stella981 Stella981
4年前
ElasticSearch底层原理浅析
基本概念索引(Index)ES将数据存储于一个或多个索引中,索引是具有类似特性的文档的集合。类比传统的关系型数据库领域来说,索引相当于SQL中的一个数据库,或者一个数据存储方案(schema)。索引由其名称(必须为全小写字符)进行标识,并通过引用此名称完成文档的创建、搜索、更新及删除操作。一个ES集群中可以按需创建任意数目的
Wesley13 Wesley13
4年前
MySql之自动同步表结构
MySql之自动同步表结构开发痛点在开发过程中,由于频繁的修改数据库的字段,导致rd和qa环境的数据库表经常不一致。而由于这些修改数据库的操作可能由多个rd操作,很难一次性收集全。人手工去和qa环境对字段又特别繁琐,容易遗漏。解决之道于是笔者就写了一个能够自动比较两个数据库的表结构,并生成