Hbase安装参考https://rumenz.com/rumenbiji/hadoop-hbase-install.html
由于我们安装的是 hbase-2.3.1-bin.tar.gz ,所以需要下载 phoenix5.0以上
下载列表:http://archive.apache.org/dist/phoenix/
我们下载phoenix-5.0.0-HBase-2.0-bin.tar.gz
>tar -xzvf phoenix-5.0.0-HBase-2.0-bin.tar.gz
>cd apache-phoenix-5.0.0-HBase-2.0-bin/
>cp phoenix-5.0.0-HBase-2.0-server.jar ../hbase-2.3.1/lib/
//然后重启hbase
>cd ../hbase-2.3.1/bin
>./stop-hbase.sh
>./start-hbase.sh
//通过phoenix访问hbase
>apache-phoenix-5.0.0-HBase-2.0-bin/bin/sqlline.py 127.0.0.1:2818
如果长时间卡住或者报错,应该是hbase启动失败,导致phoenix链接不上Hbase
解决方案:查看hbase的日志
cat hbase-2.3.1/logs/hbase-root-regionserver-xxx.log
常见错误
java.lang.NoClassDefFoundError: org/apache/htrace/Sampler
原因:
官方下载的phoenix没有HTrace(phoenix从4.1.0版本开始就加入了收集每个请求的traces的功能,这可以让你看到每个重要的步骤(例如查询操作或者插入操作)。phoenix通过利用cloudera公司的HTrace库。),需要单独下载放到hbase-2.3.1/lib/下。
我下载了:htrace-core-3.1.0-incubating.jar 1.下载链接:https://repo1.maven.org/maven2/org/apache/htrace/htrace-core/3.1.0-incubating/htrace-core-3.1.0-incubating.jar 2.拷贝htrace-core-3.1.0-incubating.jar到hbase-2.3.1/lib/目录 3.然后重启HBase即可
phoenix中shell操作
1.进入
>bin/sqlline.py 127.0.0.1:2181
2.退出(结尾不加分号)
>!quit
//或者
>!exit
3.查看所有的表
>!table
4.查看表结构和列出metadata信息
>!desc "test1"
>!dbinfo
前面命令前带!号的,后面都不需要加分号,下面所有的命令操作都需要加分号结尾。
4.创建表
4.1 如果表名和列族需要小写那么必须加上双引号,不加双引号就会变成大写
// namespace命名空间,提前在Hbase中创建好 create table "namespace:test1"("id" integer primary key,"col1"."name" varchar(30),"col2"."age" integer);
Phoenix中primary key和Hbase中RowKey的关系:在创建Phoenix table时,必须指定一个primary key,但是这个主键我们不一定要用到,我们用Phoenix创建table时,让Phoenix的主键自动的和Hbase的rowkey关联起来,可以使用如下的方法。
create table "namespace:test1"("pk" integer primary key,"col1"."name" varchar(30),"col2"."age" integer);
这样Phoenix的主键
pk
就自动的和Hbase的rowkey对应起来了
4.2不加引号创建出来的表明,列族和列都是大写
create table test1(pk integer primary key,col1.name varchar(30),col2.age integer);
表名和列族名区分大小写,加了双引号就必须用小写去查,否则查不到.列名不区分大小写,显示大写,依然可以用小写查到。
在创建table时,没有指定列族(family),只指定了列名qualifier(name,age),那么在使用Hbase shell插入数据时,要写成
put 'test1','1000','0:name','入门小站'
,否则Hbase会报错ERROR: Unknown column family! Valid column names: 0:*
5.删除表
drop table "test1";
6.修改表结构,添加属性
alter table. "test1" add sex varchar(10);
7.创建一条索引
create index "test1_index" on "test1"("col1"."name");
8.删除索引
drop "test1_index" on "test1";
9.向表中插入一条数据(字符串值只能用单引号括起来,双引号会出错,数字类型不用括起来)
upsert into "test1" values(1,'入门小站',20);
10.删除表中的数据(字符串值只能用单引号括起来,双引号会出错,数字类型不用括起来)
delete from "test1" where name='入门小站';
11.修改表中的数据(必须要带上主键id,值只能用单引号括起来,双引号会出错,数字类型不用括起来)
upsert into "test1"(id,age) values(1,30);
12.查询表中的数据(字符串值必须用单引号括起来,双引号会报错,数字类型不用括起来)
select * from "test1";
select * from "test1" where age=30;
select age,count(age) from "test2" where age>1 group by age;