Stella981 Stella981
3年前
Ambari——大数据平台的搭建利器
Ambari是什么Ambari跟Hadoop等开源软件一样,也是ApacheSoftwareFoundation中的一个项目,并且是顶级项目。目前最新的发布版本是2.0.1,未来不久将发布2.1版本。就Ambari的作用来说,就是创建、管理、监视Hadoop的集群,但是这里的Hadoop是广义,指的
Stella981 Stella981
3年前
Hadoop 新 MapReduce 框架 Yarn 详解
HadoopMapReduceV2(Yarn)框架简介原HadoopMapReduce框架的问题对于业界的大数据存储及分布式处理系统来说,Hadoop是耳熟能详的卓越开源分布式文件存储及处理框架,对于Hadoop框架的介绍在此不再累述,读者可参考Hadoop官方简介(https://www.oschina.net/action
Stella981 Stella981
3年前
Hadoop压缩
一、Hadoop压缩简介1、hadoop的3个阶段(1)分布式文件系统HDFS(2)分布式编程框架MapReduce(3)yarn框架2、Hadoop数据压缩MR操作过程中进行大量数据传输。压缩技术能够有效的减少底层存储(HDFS)读写字
Stella981 Stella981
3年前
Hadoop完整搭建过程(二):伪分布模式
1伪分布模式伪分布模式是运行在单个节点以及多个Java进程上的模式。相比起本地模式,需要进行更多配置文件的设置以及ssh、YARN相关设置。2Hadoop配置文件修改Hadoop安装目录下的三个配置文件:etc/hadoop/coresite.xmle
Stella981 Stella981
3年前
Maven添加jar包到 Ubuntu本地中心仓库
中心仓库中的jar包如下:<!https://mvnrepository.com/artifact/org.apache.hadoop/hadoopaws<dependency  <groupIdorg.apache.hadoop</groupId  <artifactIdhado
Stella981 Stella981
3年前
Hadoop伪分布式环境搭建之Linux操作系统安装
Hadoop伪分布式环境搭建之Linux操作系统安装本篇文章是接上一篇《超详细hadoop虚拟机安装教程(附图文步骤)》,上一篇有人问怎么没写hadoop安装。在文章开头就已经说明了,hadoop安装会在后面写到,因为整个系列的文章涉及到每一步的截图,导致文章整体很长。会分别先对虚拟机的安装、Linux系统安装进行介绍,然后才会写到had
Stella981 Stella981
3年前
Spark源码剖析
4. Hadoop相关配置及Executor环境变量的设置4.1 Hadoop相关配置信息默认情况下,Spark使用HDFS作为分布式文件系统,所以需要获取Hadoop相关配置信息的代码如下:!(https://oscimg.oschina.net/
Stella981 Stella981
3年前
Linux 搭建Hadoop集群错误锦集
一、Hadoop集群配置好后,执行startdfs.sh后报错,一堆permissiondeniedzfsbin$./startdfs.shStartingnamenodesonmastermaster:chown:changingownershipof'/home/zf/hadoop/hado
Wesley13 Wesley13
3年前
Linux命令集合
groupadd&&useradd创建一个普通用户hadoop,属于hadoop组,设置密码,管理员权限,自动创建home目录groupaddhadoopuseraddmphadooprghadoophadoop修改密码对于普通用户:
Stella981 Stella981
3年前
Hbase的java_API操作
package Hbase;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.had