推荐
专栏
教程
课程
飞鹅
本次共找到107条
hive
相关的信息
Stella981
•
3年前
SQL on Hadoop性能对比-Hive、Spark SQL、Impala
1三种语言、三套工具、三个架构不了解SQLonHadoop三驾马车-Hive、SparkSQL、Impala吗?听小编慢慢道来1HiveApacheHive数据仓库软件提供对存储在分布式中的大型数据集的查询和管理,它本
Stella981
•
3年前
Hive on spark下insert overwrite partition慢的优化
Hive版本:2.1.1,Spark版本是1.6.0 这几天发现insertoverwritepartition运行的很慢,看了下是hiveonspark引擎,这引擎平时比mapreduce快多了,但是怎么今天感觉比mapreduce慢了好几倍,运行了1h多还没运行完。 将SQL拿来手动hivef文件.sql执行
Stella981
•
3年前
Spark SQL重点知识总结
一、SparkSQL的概念理解SparkSQL是spark套件中一个模板,它将数据的计算任务通过SQL的形式转换成了RDD的计算,类似于Hive通过SQL的形式将数据的计算任务转换成了MapReduce。SparkSQL的特点:1、和SparkCore的无缝集成,可以在写整个RDD应用的时候,配
Easter79
•
3年前
SQL on Hadoop性能对比-Hive、Spark SQL、Impala
1三种语言、三套工具、三个架构不了解SQLonHadoop三驾马车-Hive、SparkSQL、Impala吗?听小编慢慢道来1HiveApacheHive数据仓库软件提供对存储在分布式中的大型数据集的查询和管理,它本
Wesley13
•
3年前
2020大数据面试题真题总结(附答案)
版本更新时间更新内容v1.020200701新建v1.120200613朋友面试大数据工程师提供的关于架构及数仓方面的题目v1.220200808朋友面试数据专家提供的数据驱动,spark及flink方面面试题v1.320200822朋友面试数据开发提供的关于hive及数仓方面的题目
Easter79
•
3年前
Sqoop的安装和配置以及Sqoop的基本操作
一、概述Sqoop是apache旗下一款“Hadoop和关系型数据库服务器之间传送数据”的工具。导入数据:把MySQL,Oracle数据导入到Hadoop的HDFS、HIVE、HBASE等数据存储系统;导出数据:从Hadoop的文件系统中导出数据到关系数据库mysql等!(http
Stella981
•
3年前
Hive SQL50道练习题
建表createtablestudent(s_idstring,s_namestring,s_birthstring,s_sexstring)rowformatdelimitedfieldsterminatedby'\t';createtablecourse(c_idstring,c_namestring,t_i
Stella981
•
3年前
DataX介绍
一.DataX3.0概览DataX是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。!(https://oscimg.oschina.net/oscnet/267abfdb4b4d98dada7551c730af4
Wesley13
•
3年前
2020年要做的几件大事
“2020年将成体系化技术输出2019年全年“大数据技术与架构”累计发送文章304篇。原创127篇,原创率41.8%。技术方向包含了:实时计算技术方向:Flink、Spark、Kafka等离线计算技术方向:Hive、Hadoop、HDFS、Hbase等语言基础技术方向:
Stella981
•
3年前
Hive常用参数调优十二板斧
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源!(https://oscimg.oschina.net/oscnet/7ff84748c0f944e09dfe9714e2f139fe.jpg)!(https://oscimg.oschina.net/oscnet/70efaa70534b43e1
1
•••
8
9
10
11