推荐
专栏
教程
课程
飞鹅
本次共找到231条
hadoop
相关的信息
Stella981
•
3年前
Hive SQL使用过程中的奇怪现象
hive是基于Hadoop的一个数据仓库工具,用来进行数据的ETL,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能。HiveSQL是一种类SQL语言,与关系型数据库所支持的SQL语法存在微小的差异。本文对比MySQL和Hive所支持的SQL语法,发现相同的SQL语句在
Stella981
•
3年前
Hadoop学习笔记04_Hbase
大数据开发的学习,组件还是很多的,都需要掌握并多加练习。最好的参考文档(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fhbase.apache.org%2Fapache_hbase_reference_guide.pdf)当然是官方的了。因为Hadoop生态圈组件很多,所以,在建设
Stella981
•
3年前
Hadoop 系列YARN:资源调度平台(YARN参数解读与调优)
YARN:资源调度平台YARN参数解读与调优yarnsite.xml文件默认参数:http://hadoop.apache.org/docs/r2.7.3/hadoopyarn/hadoopyarncommon/yarndefault.xml(https://www.oschina.
Stella981
•
3年前
Hadoop(十四)——hadoop之MapReduce理论篇(五)——MapReduce详细工作流程
一、Shuffle机制Mapreduce确保每个reducer的输入都是按键排序的。系统执行排序的过程(即将map输出作为输入传给reducer)称为shuffle。二、MapReduce工作流程1.图示流程!(https://oscimg.oschina.net/oscnet/b44af54dac168
Stella981
•
3年前
Hadoop云计算的初步认识
在说Hadoop之前,作为一个铁杆粉丝先粉一下Google。Google的伟大之处不仅在于它建立了一个强悍的搜索引擎,它还创造了几项革命性的技术:GFS,MapReduce,BigTable,即所谓的Google三驾马车。Google虽然没有公布这几项技术的实现代码,但它发表了详细的设计论文,这给业界带来了新鲜气息,很快就出现了类似于Google三驾马车的开
Stella981
•
3年前
MapReduce简单使用
1、启动hadoop工程!(http://static.oschina.net/uploads/space/2015/0510/202542_tg2o_1863482.png)(http://static.oschina.net/uploads/space/2015/0510/202542_tg2o_1863482.pn
Wesley13
•
3年前
Hadoop Streaming 实战: 文件分发与打包
如果程序运行所需要的可执行文件、脚本或者配置文件在Hadoop集群的计算节点上不存在,则首先需要将这些文件分发到集群上才能成功进行计算。Hadoop提供了自动分发文件和压缩包的机制,只需要在启动Streaming作业时配置相应的参数。1\.–file将本地文件分发到计算结点2\.–cacheFile文件已经存放在HDFS中,希望计算时
Stella981
•
3年前
Solr
1Solr部署1.1环境准备:系统环境:CentOSLinuxrelease7.2.1511(Core)软件环境:Hadoop环境已搭建,其中包括了java以及zookeeperJavaversion"1.7.0\_79"Zookeeper3.4.5cdh5.2.
Stella981
•
3年前
Hive和HBase有哪些区别与联系及适用场景
hiveHive是运行在Hadoop上的一个工具,准确地讲是一个搜索工具。当对海量数据进行搜索时,Hadoop的计算引擎是MapReduce。但是对MapReduce的操作和编程是非常复杂的。于是Hive的存在就让复杂的编程过程简化成了用SQL语言对海量数据的操作。这大大减轻了程序员的工作量。可以说,Hive的存在让海量数据的增删改查更加方便。
Stella981
•
3年前
Hive
解释:1、JVM重用是hadoop调优参数的内容,对hive的性能具有非常大的影响,特别是对于很难避免小文件的场景或者task特别多的场景,这类场景大多数执行时间都很短。hadoop默认配置是使用派生JVM来执行map和reduce任务的,这是jvm的启动过程可能会造成相当大的开销,尤其是执行的job包含有成千上万个task任务的情况。JVM重用可
1
•••
9
10
11
•••
24