1. 什么是分布式系统的CAP？

CAP是指一致性（Consistency）、可用性（Availability）和分区容错性（Partition tolerance）。

Consistency 一致性

一致性指更新操作成功并返回客户端完成后，分布式系统中所有节点在同一时间的数据完全一致。

从客户端的角度来看，一致性主要指的是并发访问时获取的数据一致。从服务端来看，则是更新如何复制分布到整个系统，以保证数据最终一致。

对于数据库来说，如果要求更新过的数据能被后续的访问都能看到，这是强一致性。如果能容忍后续的部分或者全部访问不到，则是弱一致性。如果经过一段时间后要求能访问到更新后的数据，则是最终一致性。

Availability 可用性

可用性指服务一直可用，整个系统是可以正常响应的。一般我们在衡量一个系统的可用性的时候，都是通过停机时间来计算的。我们经常说的3个9，4个9的SLA，就是对于可用性的量化表述。

Partition Tolerance分区容错性

分区容错性指分布式系统在遇到某节点或网络分区故障的时候，仍然能够对外提供满足一致性和可用性的服务。

而CAP定理证明，一个分布式系统最多只能同时满足这三项中的两项。

由于分布式系统中必然存在网络分区，所以对于分布式系统而言，一般分为CP系统和AP系统。

也就是说，如果出现故障了，到底是选择可用性优先（AP）呢？还是选择一致性优先(CP)？

2.HBase的CAP权衡

HBase作为分布式数据库，同样满足CAP理论，那它是AP系统，还是CP系统呢？

我们从HBase的故障恢复过程来分析一下。

当某台region server fail的时候，它管理的region failover到其他region server时，需要根据WAL log（Write-Ahead Logging）来redo，这时候进行redo的region应该是不可用的，客户端请求对应region数据时，会抛出异常。

因此，HBase属于CP型架构，降低了可用性，具备强一致性读/写。

设想一下，如果redo过程中的region能够响应请求，那么可用性提高了，则必然返回不一致的数据(因为redo可能还没完成)，那么hbase的一致性就降低了。

3.HBase的可用性分析

作为一个CP系统，HBase的可用性到底如何，我们还需要进一步分析它的各个组件。

下面是一个HBase集群的相关组件。

HBase可用性分析与高可用实践

以HBase 单集群 2个master + 3个core 节点作为例子，各个组件的部署情况如下：

HBase可用性分析与高可用实践

HBase:

两个HMaster互为主备，保证高可用
蓝色的region server表示会存有meta table
用户缓存meta table信息，直接与region server交互，查询，不需要经过HMaster
core可以横向扩展，存在多个region server和data node。

Zookeeper：

三节点集群

HDFS：

两个namenode，多个DataNode

在这样的部署下，各个组件的可用性分析如下：

HBase可用性分析与高可用实践

从上面的分析可以看到，HBase的不可用风险主要有两个：

1）某个region server不可用，导致该region server上的流量有分钟级的不可读写

2）集群整体不可用，所有流量不可读写

4. 如何提高HBase可用性

4.1 Region replica

上面提到了HBase为了保证数据的强一致性，在可用性上有所牺牲，根本原因是虽然是三副本的数据存储，但是同一时刻只有一个“在线”Region（保证一致性），所以一旦该region不可用，需要通过日志回放来重新拉起一个新的region，而且此时region不可读写（保证一致性）。

因此，如果能增加“在线”的Region数量，就可以提高可用性了，可以参考这个Region replica（https://issues.apache.org/jira/browse/HBASE-10070 ）。需要注意，副本region只能作为读，不能作为写。因此主region挂了以后，仍然会有不可写入时间。