Wesley13 Wesley13
3年前
Spark核心类:弹性分布式数据集RDD及其转换和操作pyspark.RDD
http://blog.csdn.net/pipisorry/article/details/53257188(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fblog.csdn.net%2Fpipisorry%2Farticle%2Fdetails%2F53257188)弹性分布
菜园前端 菜园前端
1年前
程序员必备-了解Git
原文链接:什么是Git?git是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。可以理解为git就是一个代码管理的仓库。指导在学习一个新知识的时候,我们主要围绕这个思想去学习,就是为什么要学习这个新技术/知识,它的出现有什么作用?带来了
Stella981 Stella981
3年前
Spring Boot + Spring Cloud 构建微服务系统(八):分布式链路追踪(Sleuth、Zipkin)
技术背景在微服务架构中,随着业务发展,系统拆分导致系统调用链路愈发复杂,一个看似简单的前端请求可能最终需要调用很多次后端服务才能完成,那么当整个请求出现问题时,我们很难得知到底是哪个服务出了问题导致的,这时就需要解决一个问题,如何快速定位服务故障点,于是,分布式系统调用链追踪技术就此诞生了。ZipKinZipkin是一个
Stella981 Stella981
3年前
GitLab 安装配置指南
GitLab在CentOS7系统上的安装配置指南1、简单介绍GitLab是利用RubyonRails开发的一个开源版本管理系统,实现一个自托管的Git管理仓库,可通过Web界面进行访问、管理控制权限。Git的家族成员介绍Git:是一种开源分布式的版本控制系统,是一个命令,是一种工具。是伟大的程
Wesley13 Wesley13
3年前
2018年终总结
序不知不觉一年又要过去了,又到了写总结的时候了。盘点整体而言,今年技术层面稍微有点拓宽,跨入了外表看上去高大上的流式计算领域,打开了另外一扇窗;而基于java的分布式/微服务领域,今年变化比较大,springcloudnetflix的部分组件宣布将要进入维护阶段,而国内springcloudalibaba组件逐渐活跃起来,目前看
Stella981 Stella981
3年前
Kylin使用Spark构建Cube
ApacheKylin™是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBayInc.开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。下面是单机安装采坑记,直接上配置和问题解决。找一台干净的机器,把hadoophivehbase从原有节点分别拷贝一
Wesley13 Wesley13
3年前
MongoDB 安装及文档的基本操作
!(https://oscimg.oschina.net/oscnet/upd8eda6ee91df47c0b9dc9005b1f5b85acd1.JPEG)前言MongoDB是一个基于分布式文件存储的半结构化的非关系型数据库。在海量数据中,可以较高性能的处理存取操作。它是以BSON格式进行数据存储(类似JSON格式,但类型更为
Stella981 Stella981
3年前
ElasticSearch基本操作(安装,索引的创建和删除,映射)
ElasticSearch基于Lucene的搜索服务器,支持分布式,提供REST接口,可用于云计算,可以实现实时搜索,开源免费。这时很官方的一句话,在使用之前,我们简单的介绍一下安装过程。在官网下载之后,直接解压出来,找到bin文件夹下,运行elasticsearch.bat,运行后的结果如下:!(https://oscimg.oschina.net
分布式数据库 Join 查询设计与实现浅析 | 京东云技术团队
文章从常用的关系型数据库MySQL的分库分表Join分析,再到非关系型ElasticSearch来分析Join实现策略。逐步深入Join的实现机制。