桃浪十七丶 桃浪十七丶
3年前
云计算与Hadoop期末考试知识点复习
七、八、九、十、十二、十三放到一起理解。一、大数据的概念和特点、分类又称巨量数据,是指数据量达到无法用人脑,甚至现有工具获取,处理,并整理成为帮助企业经营决策更积极目的的资讯。特点:数据量大,类型多,时效性,速度快,真实性。分类:传统企业数据,机器和传感器数据,社交数据。二、云计算的概念,特点云计算是基于互联网的计算机方式,通过这计算方式,可以把共享的
Stella981 Stella981
3年前
Spark1.6.0 on Hadoop2.6.0单机伪分布式安装
1、Scala安装(1)解压文件ubuntu@Ubuntu:~$ sudo tar zxvf scala2.10.4.gz C /opt !(https://oscimg.oschina.net/oscnet/5fc13090fea3cd9b3e6829d482a1b5f43d9.png)(2) 环境变量配置ubunt
Stella981 Stella981
3年前
Redis之集群环境部署
在进行redis集群部署之前,兄弟们最好先在自己的虚拟机上安装好单机版的redis,安装方法很简单,兄弟们可自行用度娘度一下,这里就不再赘述了,本人也是上班时间抽空偷偷写的该博文,也得处处小心被捉了!好了,闲话少说,进入正题哈!第一步搭建ruby环境     先来说说redis用啥来做集群,我们知道hadoop可
Stella981 Stella981
3年前
Linux 网络配置情况 总体梳理
题记:Linux网络配置这个问题。常常在配置,但仍然常出错。希望这次做一个整体梳理,能够解决日后遇见的大体问题。在搭建Hadoop集群的过程中,由于一次意外关机,之后启动集群中的三台Linux虚拟机master、node1、node2,网络连接失败。三台虚拟机之间互相都ping不同,也ping不同外网和网关。只能ping通localhost和127.
Stella981 Stella981
3年前
MapReduce 基本原理(MP用于分布式计算)
hadoop最主要的2个基本的内容要了解。上次了解了一下HDFS,本章节主要是了解了MapReduce的一些基本原理。MapReduce文件系统:它是一种编程模型,用于大规模数据集(大于1TB)的并行运算。MapReduce将分为两个部分:Map(映射)和Reduce(归约)。当你向mapreduce框架提交一个计算作业,它会首先把计算作业分成若干个
Stella981 Stella981
3年前
EMC升级的ViPR进击在大数据
EMC发布了一个更新的ViPR,该公司的软件定义的存储管理平台,使企业可选用,从数据方面看,目前驻留在他们的存储系统,没有它转移到专门的系统上。在公开的的文章中,EMC公司的高级软件事业部副总裁ManuvirDas宣布,EMC“加强的ViPR的一个Hadoop分布式文件系统(HDFS)数据服务(https://www.osc
Stella981 Stella981
3年前
Hadoop 气数已尽!逃离复杂性,拥抱云计算
!(https://oscimg.oschina.net/oscnet/355facaec00d46ee851ad87cfdfa754a.gif)作者|MattAsay,译者|杨志昂来源:高效开发运维导读:虽然大数据依然如日中天,但该领域曾经的领头羊Cloudera、Hortonworks和MapR三家公司最近步履
Stella981 Stella981
3年前
Hadoop集群安装指南(CHD5.9.1)(分布式+图文详解)
centos7.1,CDH5.9.1,3台机器,终极指导安装<!more下载链接如下:安装文件下载链接如下:链接:https://pan.baidu.com/s/1RQYNiWn9aT8GXcCsoDBsA(https://www.oschina.net
Stella981 Stella981
3年前
Hadoop案例(八)辅助排序和二次排序案例(GroupingComparator)
辅助排序和二次排序案例(GroupingComparator)1.需求有如下订单数据订单id商品id成交金额0000001Pdt\_01222.80000001Pdt\_0525.80000002Pdt\_03522.80000
Wesley13 Wesley13
3年前
Dubbo学习总结(3)——Dubbo
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。    Dubbo是Alibaba开源的分布式服务框架,它最大的特点是按照分层的方式来架构,使用