分布式---CAPBASE理论

news/2024/10/25 9:19:15/

CAP理论

  • Consistency(一致性):用户访问分布式系统中的任意节点,得到的数据必须一致。即保证任意节点的数据内容一致
  • Availability(可用性):用户访问集群中的任意健康节点,必须能得到响应,而不是超时或拒绝。
  • Partition tolerance (分区容错性):因为网络故障或其它原因导致分布式系统中的部分节点与其它节点失去连接,形成独立分区

它们的第一个字母分别是 C、A、P。

Eric Brewer 说,这三个指标不可能同时做到。这个结论就叫做 CAP 定理。

注意:这里的三选二其实是有限制的:在分布式系统中P(分区容错性是一定要满足的),然后才是可以从A,C中选,即要么AP,要么CP,理论上分布式系统是不可能选择CA结构的

那么为什么理论上不可能出现CA尼?比如:如果系统出现分区,系统中的某个节点进行了写操作。为了保证C,那么就比如禁止其他节点的读操作,这就违反了A.如果要保证A,那么其他节点的读操作正常进行,那么就违反了C

总结

简述CAP定理内容

  • 分布式系统节点通过网络来进行连接,呢么会出现分区问题(P)可能性就很大
  • 当分区出现时,系统的一致性(C)和可用性(A)就无法同时满足
    • 如果此时要保证一致性,就必须等待网络恢复,完成数据同步后,整个集群才对外提供服务,服务处于阻塞状态,不可用。
    • 如果此时要保证可用性,就不能等待网络恢复,那node01、node02与node03之间就会出现数据不一致。

也就是说,在P一定会出现的情况下,A和C之间只能实现一个。

当没出现分区问题的话那么我们就需要尽可能去满足CA

如果系统没有发生“分区”的话,节点间的网络连接通信正常的话,也就不存在 P 了。这个时候,我们就可以同时保证 C 和 A 了。因此,如果系统发生“分区”,我们要考虑选择 CP 还是 AP。如果系统没有发生“分区”的话,我们要思考如何保证 CA 。

2.1.1.一致性

Consistency(一致性):用户访问分布式系统中的任意节点,得到的数据必须一致。

比如现在包含两个节点,其中的初始数据是一致的:

当我们修改其中一个节点的数据时,两者的数据产生了差异:

要想保住一致性,就必须实现node01 到 node02的数据 同步:

2.1.2.可用性

Availability (可用性):用户访问集群中的任意健康节点,必须能得到响应,而不是超时或拒绝。

如图,有三个节点的集群,访问任何一个都可以及时得到响应:

当有部分节点因为网络故障或其它原因无法访问时,代表节点不可用:

2.1.3.分区容错

Partition(分区):因为网络故障或其它原因导致分布式系统中的部分节点与其它节点失去连接,形成独立分区。

这时node02上的数据发生了更新,此时会将修改的数据同步到node01,但是node03中由于和2由于网络断开连接了,因此23数据就发生了不一致现象

Tolerance(容错):在集群出现分区时,整个系统也要持续对外提供服务

2.1.4.矛盾

分布式系统中,系统间的网络不能100%保证健康,一定会有故障的时候,而服务有必须对外保证服务。因此Partition Tolerance不可避免。

当节点接收到新的数据变更时,就会出现问题了:

如果此时要保证一致性,就必须等待网络恢复,完成数据同步后,整个集群才对外提供服务,服务处于阻塞状态,不可用。

如果此时要保证可用性,就不能等待网络恢复,那node01、node02与node03之间就会出现数据不一致。

也就是说,在P一定会出现的情况下,A和C之间只能实现一个。

总结

简述CAP定理内容

  • 分布式系统节点通过网络来进行连接,一定会出现分区问题(P)
  • 当分区出现时,系统的一致性(C)和可用性(A)就无法同时满足

2.2.BASE理论

基本思想

BASE理论是对CAP的一种解决思路,包含三个思想:

  • Basically Available (基本可用)分布式系统在出现故障时,允许损失部分可用性,即保证核心可用。
  • Soft State(软状态):在一定时间内,允许出现中间状态,比如临时的不一致状态。
  • Eventually Consistent(最终一致性):虽然无法保证强一致性,但是在软状态结束后,最终达到数据一致。

基本可用性的理解:

什么叫允许损失部分可用性呢?

  • 响应时间上的损失: 正常情况下,处理用户请求需要 0.5s 返回结果,但是由于系统出现故障,处理用户请求的时间变为 3 s。
  • 系统功能上的损失:正常情况下,用户可以使用系统的全部功能,但是由于系统访问量突然剧增,系统的部分非核心功能无法使用。
软状态(Soft State)

软状态指允许系统中的数据存在中间状态CAP 理论中的数据不一致),并认为该中间状态的存在不会影响系统的整体可用性,即允许系统在不同节点的数据副本之间进行数据同步的过程存在延时

最终一致性(Eventually Consistent)

最终一致性强调的是系统中所有的数据副本,在经过一段时间的同步后最终能够达到一个一致的状态。因此,最终一致性的本质是需要系统保证最终数据能够达到一致,而不需要实时保证系统数据的强一致性。

分布式一致性的 3 种级别:

  1. 强一致性:系统写入了什么,读出来的就是什么。(一般保证强一致性可以考虑加锁同步操作)
  2. 弱一致性:不一定可以读取到最新写入的值,也不保证多少时间之后读取到的数据是最新的,只是会尽量保证某个时刻达到数据一致的状态。
  3. 最终一致性:弱一致性的升级版,系统会保证在一定时间内达到数据一致的状态。

业界比较推崇是最终一致性级别,但是某些对数据一致要求十分严格的场景比如银行转账还是要保证强一致性。

2.3.解决分布式事务的思路

分布式事务最大的问题是各个子事务的一致性问题,因此可以借鉴CAP定理和BASE理论,有两种解决思路:

  • AP模式(最终一致性思想):各子事务分别执行和提交,允许出现结果不一致,然后采用弥补措施恢复数据即可,实现最终一致。
  • CP模式(强一致性):各个子事务执行后互相等待,同时提交,同时回滚,达成强一致。但事务等待过程中,处于弱可用状态。即各个分支事务执行完业务后先别提交,等待彼此结果,之后再做统一提交

但不管是哪一种模式,都需要在子系统事务之间互相通讯,协调事务状态,也就是需要一个事务协调者(TC)

这里的子系统事务,称为分支事务;有关联的各个分支事务在一起称为全局事务

对于分布式事务解决框架Seata使用

参考分布式事务


http://www.ppmy.cn/news/1541802.html

相关文章

64页精品PPT | 汽车经销商数据应用解决方案

汽车经销商正面临前所未有的盈利能力挑战。从18年起 ,传统燃油车汽车行业开始步入低速增长阶段 ,卖车已经挣不到钱 ,利润往往来自任务完成的厂家返利;新兴的直营模式的出现 ,冲击了传统授权经销的方式 ,疫情…

LeetCode--验证二叉搜索树--深度优先遍历dfs

一、题目解析 二、算法原理 首先说一下二叉搜索树的概念,二叉搜索树是左子树只包含小于当前节点的数,右子树只包含大于当前节点的数,并且左子树和右子树也必须是二叉搜索树。 由此我们可以得出二叉搜索树的中序遍历的结果是一个有序的序列…

Python数值计算(32)——simpson 1/3积分公式

1. 背景知识 前面我们通过用矩形和梯形的数值算法,近似实现了数值积分,那么,和之前插值类似,是否可以使用多项式来拟合曲线,然后将该多项式作为被积函数求积分呢?当然是可行的,如果以最简单的二…

【Docker系列】深入理解`docker export`与`docker import`

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

【某农业大学计算机网络实验报告】实验五 TCP 运输连接管理

实验目的: 熟悉 TCP 通信的三个阶段:通过此次实验,结合理论课知识深入理解并熟悉 TCP 通信的三个主要阶段,即连接建立(SYN-SYN),数据传输(DATA),以及连接释放…

Python异步编程:使用`asyncio`和`aiofiles`进行高效的文件批量写入

Python异步编程:使用asyncio和aiofiles进行高效的文件批量写入 1. 异步编程基础1.1 asyncio和await1.2 aiofiles 2. 异步文件批量写入示例2.1 代码结构2.2 代码实现2.3 代码解释2.3.1 BatchWriter类2.3.2 main函数 3. 其他示例代码3.1 简单的异步文件写入3.2 异步文…

构建effet.js人脸识别交互系统的实战之路

文章目录 前言一、什么是effet.js二、为什么需要使用effet.js四、effet.js能做什么五、使用步骤1.引入库2.main.js中注册全局2.使用3.效果图 六、其他模式讲解人脸打卡人脸添加睡眠检测 在h5中的使用总结 前言 在当今数字化的时代,用户体验变得尤为重要&#xff0c…

软考:缓存分片和一致性哈希

缓存分片技术是一种将数据分散存储在多个节点上的方法,它在分布式缓存系统中尤为重要。这项技术的核心目的是提高系统的性能和可扩展性,同时确保数据的高可用性。以下是缓存分片技术的一些关键点: 数据分片:缓存分片涉及将数据分成…