Stella981 Stella981
3年前
Hive重写表数据丢失风险记录
若在Hive中执行INSERTOVERWRITE重写同一个表的数据时,有可能会造成数据丢失。如INSERTOVERWRITETABLEtable\_nameSELECT\FROMtable\_name一、新建一张分区表createtabletest_chj_cols(idstr
Stella981 Stella981
3年前
Flink 1.10 和 Hive 3.0 性能对比(附 Demo 演示 PPT)
如今的大数据批计算,随着Hive数仓的成熟,普遍的模式是Hivemetastore计算引擎。常见的计算引擎有HiveonMapReduce、HiveonTez、HiveonSpark、SparkintegrateHive、PrestointegrateHive,还有随着Flink1.10发布后生产可用的Flink
Stella981 Stella981
3年前
Hive出现拒绝连接ConnectionRefused 解决
Causedby:java.net.ConnectException:CallFromnn1.hadoop/192.168.10.6tonn2.hadoop:9000failedonconnectionexception:java.net.ConnectException:拒绝连接;Formoredetailssee:
Wesley13 Wesley13
3年前
VirtualBox、CentOS 6.4、Hadoop、Hive玩起
1 安装VirtualBox:VirtualBox是一款开源免费的并且非常强大的虚拟机软件,同时支持X86和AMD64/Intel64,可以在多个操作系统平台上运行。与同性质的VMWare和VirtualPC比较,VirtualBox独到之处包括支持远程桌面协议RDP、iSCSI及USB的支持。在64为旗舰版Wind
Wesley13 Wesley13
3年前
mysql 导入hive的脚本
!/bin/bashtanj20170911DATE\date%Y%m%d\TIME\date%H:%M:%S\echo"$DATE$TIMEstart"if \!n"$1"\;then  
Stella981 Stella981
3年前
HIVE的常用操作(HQL)语句
HIVE基本操作命令创建数据库\createdatabasedb\_name;\createdatabaseifnotexistsdb\_name;//创建一个不存在的数据库final查看数据库\showdatabases;选择性查看数据库\showdatabaseslike'f.\'
Stella981 Stella981
3年前
Hive 练习 简单任务处理
1、2018年4月份的用户数、订单量、销量、GMV (不局限与这些统计量,你也可以自己想一些)2018年4月份的用户数量selectcount(a.user_id)asuser_numsfrom(selectuser_idfrom
Stella981 Stella981
3年前
Hive 时间日期处理总结
selectday时间,date_add(day,1dayofweek(day))
Stella981 Stella981
3年前
Python 连接 hive 查询数据
<!lang:shellJpsjdk1.5时引入的一个工具,可以用来查看当前主机所有java进程的ID的一个命令行工具。root@PROC_141httjps966CassandraDaemon22070NameNode2471Jps2221
Stella981 Stella981
3年前
Hive小知识之分桶抽样
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源!(https://oscimg.oschina.net/oscnet/5d1ed9fd1b5f4d4c0815c43612661c3c6ce.jpg)!(https://oscimg.oschina.net/oscnet/dc13c086ab4913119194