CAP定理

1.CAP

1.1 定义

以下定义来自维基。
在理论计算机科学中，CAP定理（CAP theorem），又被称作布鲁尔定理（Brewer's theorem），它指出对于一个分布式计算系统来说，不可能同时满足以下三点：

一致性（Consistency）（等同于所有节点访问同一份最新的数据副本）
可用性（Availability）（每次请求都能获取到非错的响应——但是不保证获取的数据为最新数据）
分区容错性（Partition tolerance）（以实际效果而言，分区相当于对通信的时限要求。系统如果不能在时限内达成数据一致性，就意味着发生了分区的情况，必须就当前操作在C和A之间做出选择。）

1.2 分区容错性P

1.2.1 为什么有分区容错性

在分布式服务中，如果数据只被保存在一个节点中，如果这个节点不可达（在多个节点中，总有网络问题导致节点不可达），数据就不可以访问，这就是分区没有容错性。

1.2.2 怎么解决？

其中一个办法就是复制到多个节点上。这就是分区容错性。

1.2.3 带来了什么问题？

不同的节点之间数据的一致性问题。为了保证一致性，多个节点之间同步的时间越长，可用性就会下降。

1.3 一致性C

意思是，写操作之后的读操作，必须返回该值。举例来说，某条记录是 v0，用户向 G1 发起一个写操作，将其改为 v1。
CAP定理的理解
接下来，用户的读操作就会得到 v1。这就叫一致性。

为了让 G2 也能变为 v1，就要在 G1 写操作的时候，让 G1 向 G2 发送一条消息，要求 G2 也改成 v1。

这样的话，用户向 G2 发起读操作，也能得到 v1。

那么我们思考一个问题，如果G1的值已经是v1，想同步给G2时，发现G1和G2之间的网络断开，为了满足一致性，那就需要锁住G2的读写操作，这段时间内，客户端不能访问G2，没有可用性。

1.3 可用性A

1.3.1 再次思考G1和G2之间的网络断开问题

CAP定理的理解
当客户端将G1的数据更新成v1，G1要更新数据到G2，但是发现网络出错了，G2数据不能同步成最新。这是客户端来读取G2的数据，为了满足可用性，就需要给客户端返回数据，尽管数据不是最新的。这就不满足一致性。也就是说分区容错性P一定要满足，那一致性C和可用性A就只能二选一。那我们怎么选择呢？