Spring Cloud——Circuit Breaker上篇

embedded/2024/10/18 21:24:25/

Spring Cloud——Circuit Breaker上篇

  • 一、分布式系统面临的问题
    • 1.服务雪崩
    • 2.禁止服务雪崩故障
  • 二、Circuit Breaker
  • 三、resilience4j——服务熔断和降级
    • 1.理论知识
    • 2.常用配置
    • 3.案例实战
      • (1)COUNT_BASED(计数的滑动窗口)
      • (2)TIME_BASED(时间的滑动窗口)
  • 四、参考

一、分布式系统面临的问题

  • 复杂分布式体系结构中的应用程序有数十个依赖关系,每个依赖关系在某些时候将不可避免地失败。

1.服务雪崩

  • 多个微服务之间调用的时候,假设微服务A调用微服务B和微服务C,微服务B和微服务C又调用其他的微服务,这就是所谓的“扇出”。如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,所谓的“雪崩效应”。
  • 对于高流量的应用来说,单一的后端依赖可能会导致所有服务器上的所有资源都在几秒钟内饱和。比失败更糟糕的是,这些应用程序还可能导致服务之间的延迟增加,备份队列,线程和其他系统资源紧张,导致整个系统发生更多的级联故障。这些都表示需要对故障和延迟进行隔离和管理,以便单个依赖关系的失败,不能取消整个应用程序或系统。
  • 通常当你发现一个模块下的某个实例失败后,这时候这个模块依然还会接收流量,然后这个有问题的模块还调用了其他的模块,这样就会发生级联故障,或者叫雪崩。

2.禁止服务雪崩故障

  • 有问题的节点,快速熔断(快速返回失败处理或者返回默认兜底数据【服务降级】)。
  • “断路器”本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方返回一个符合预期的、可处理的备选响应(FallBack),而不是长时间的等待或者抛出异常调用方法处理的异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。

二、Circuit Breaker

在这里插入图片描述

  • Circuit Breaker 只是一套规范和接口,落地实现者是 Resilience4j(resilience For Java)Spring Retry

三、resilience4j——服务熔断和降级

1.理论知识

  • Circuit Breaker 有三个普通状态:关闭(CLOSED)开启(OPEN)半开(HALF_OPEN),还有两个特殊状态:禁用(DISABLED)强制开启(FORCED_OPEN)
    在这里插入图片描述
    • 当断路器 CLOSED 时,所有的请求都会通过断路器。
    • 如果失败率超过设定的阈值,断路器 CLOSED ---> OPEN,这时所有的请求都会被拒绝。
    • 当经过一段时间后,断路器OPEN ---> HALF_OPEN,这时仅有一定数量的请求会被放入,并重新计算失败率。
    • 如果失败率仍超过阈值,则断路器 HALF_OPEN ---> OPEN,如果失败率低于阈值,则断路器 HALF_OPEN ---> CLOSED
  • 断路器使用滑动窗口来存储和统计调用的结果。
    • 基于调用数量的滑动窗口:基于访问数量的滑动窗口统计了最近 N 次调用的返回结果。
    • 基于时间的滑动窗口:基于时间的滑动窗口统计了最近 N 秒的调用返回结果。
  • 除此之外,断路器还会有两种特殊状态:DISABLE(始终允许访问)FOCRED_OPEN(始终拒绝访问)
    • 这两个状态不会生成熔断器事件(除状态转换外),并且不会记录请求的成功或失败。
    • 退出这两个状态的唯一方法就是触发状态转换或者重置断路器

2.常用配置

配置属性默认值描述
slidingWindowTypeCOUNT_BASED配置滑动窗口的类型,当断路器关闭时,将调用的结果记录在滑动窗口中。滑动窗口的类型可以是count-based或time-based。如果滑动窗口类型是COUNT_BASED,将会统计记录最近slidingWindowSize次调用的结果。如果是TIME_BASED,将会统计记录最近slidingWindowSize秒的调用结果。
slidingWindowSize100配置滑动窗口的大小。
failureRateThreshold50以百分比配置失败率阈值。当失败率等于或大于阈值时,断路器状态从关闭变为开启,并进行服务降级。
slowCallDurationThreshold6000[ms]配置调用时间的阈值,高于该阈值的呼叫视为慢调用,并增加慢调用比例。
slowCallRateThreshold100以百分比的方式配置,断路器把调用时间大于slowCallDurationThreshold的调用视为慢调用,当慢调用比例大于等于阈值时,断路器开启,并进行服务降级。
permittedNumberOfCallsInHalfOpenState10断路器在半开状态下允许通过的调用次数。
minimumNumberOfCalls100断路器计算失败率或慢调用率之前所需的最小调用数(每个滑动窗口周期)。例如,如果minimumNumberOfCalls为10,则必须至少记录10个调用,然后才能计算失败率。如果只记录了9次调用,即使所有9次调用都失败,断路器也不会开启。
waitDurationInOpenState6000[ms]断路器从开启过渡到半开应等待的时间。

3.案例实战

  • 具体案例:
    • 6 次访问中当执行方法的失败率达到 50% 时 CircuitBreaker 将进入开启 OPEN 状态(保险丝跳闸断电),拒绝所有请求。
    • 等待 5 秒后,CircuitBreaker 将自动从开启 OPEN 状态过渡到半开 HALF_OPEN 状态,允许一些请求通过以测试服务是否恢复正常。
    • 如还是异常 CircuitBreaker 将重新进入开启 OPEN 状态;如正常将进入关闭 CLOSE 关闭状态恢复正常处理请求。
      在这里插入图片描述

(1)COUNT_BASED(计数的滑动窗口)

  • 第一步,在调用服务方引入 Circuit Breaker 相关的依赖
    <!--resilience4j-circuitbreaker-->
    <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-circuitbreaker-resilience4j</artifactId>
    </dependency>
    <!-- 由于断路保护等需要AOP实现,所以必须导入AOP包 -->
    <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-aop</artifactId>
    </dependency>
    
  • 第二步,在OpenFeign中开启circuitbreaker
    spring:cloud:openfeign:# 开启 circuitbreaker 和 分组激活circuitbreaker:enabled: true# 没开分组永远不用分组的配置。精确优先、分组次之(开了分组)、默认最后group:enabled: true
    
  • 第三步,配置resilience4j相关的配置
    # 服务器的熔断降级配置
    resilience4j:circuitbreaker:configs:default:# 设置 50% 的失败率,超过失败请求百分比 CircuitBreaker 变为 OPEN 状态。failure-rate-threshold: 50 # 滑动窗口类型sliding-window-type: COUNT_BASED# 滑动窗口的大小, 配置 COUNT_BASED 表示 6 个请求,配置 TIME_BASED 表示 6 秒。sliding-window-size: 6# 断路器计算失败率或慢调用率之前所需的最小样本(每个滑动窗口周期)。如果 minimumNumberOfCalls 为 10, 则必须最少记录 10 个样本,然后才能计算失败率。如果只记录了9次调用,即使所有9次调用都失败,断路器也不会开启。minimum-number-of-calls: 6# 是否启用自动从 OPEN ---> HALF_OPEN, 默认值就为 TRUEautomatic-transition-from-open-to-half-open-enabled: true  # 从 OPEN 到 HALF_OPEN状态需要等待的时间wait-duration-in-open-state:seconds: 1# 半开状态允许的最大请求值为 10.permitted-number-of-calls-in-half-open-state: 2# 记录的异常类型record-exceptions:- java.lang.Exception# 以上的配置适用于那个微服务instances:cloud-payment-service:base-config: default
    
  • 第四步,编写Controller
    @RestController
    @RequestMapping("/circuit")
    public class CircuitController {@Resourceprivate PayCircuitFeignAPI payCircuitFeignAPI;@GetMapping("/order/{id}")@CircuitBreaker(name = "cloud-payment-service", fallbackMethod = "myCircuitFallback")public String myCircuit(@PathVariable("id") Integer id) {return payCircuitFeignAPI.myCircuit(id);}/*** myCircuitFallback就是服务降级后的兜底处理方法*/public String myCircuitFallback(Integer id, Throwable t) {// 这里是容错处理逻辑,返回备用结果return "myCircuitFallback,系统繁忙,请稍后再试-----/(ㄒoㄒ)/~~";}
    }
    

(2)TIME_BASED(时间的滑动窗口)

  • 只需要将上面基于次数的滑动窗口中关于resilience4j相关的配置修改为如下
    # 服务器的熔断降级配置
    resilience4j:timelimiter:configs:default:# 神坑的位置,timelimiter 默认限制远程 1s,超过 1s 就超时异常,配置了降级,就直接走降级逻辑了timeout-duration:seconds: 20circuitbreaker:configs:default:#设置 50% 的失败率,超过失败请求百分比 CircuitBreaker 变为 OPEN 状态。failure-rate-threshold: 50# 滑动窗口类型 sliding-window-type: TiME_BASED# 慢调用时间阈值,高于这个阈值的视为慢调用并增加慢调用比例。slow-call-duration-threshold:seconds: 2#慢调用百分比峰值,断路器把调用时间大于 slow-call-duration-threshold,视为慢调用,当慢调用比例高于这个的时候进入到 OPEN。 slow-call-rate-threshold: 30# 滑动窗口的大小, 配置 COUNT_BASED 表示 2 个请求,配置 TIME_BASED 表示 2 秒。 sliding-window-size: 2 # 断路器计算失败率或慢调用率之前所需的最小样本(每个滑动窗口周期)。如果 minimumNumberOfCalls 为 10, 则必须最少记录 10 个样本,然后才能计算失败率。如果只记录了9次调用,即使所有9次调用都失败,断路器也不会开启。minimum-number-of-calls: 2 automatic-transition-from-open-to-half-open-enabled: true  # 是否启用自动从 OPEN ---> HALF_OPEN, 默认值就为 TRUE# 从 OPEN 到 HALF_OPEN状态需要等待的时间wait-duration-in-open-state:seconds: 10  # 半开状态允许的最大请求值为permitted-number-of-calls-in-half-open-state: 2 # 记录的异常类型record-exceptions:- java.lang.Exception# 以上的配置适用于那个微服务instances:cloud-payment-service:base-config: default
    

四、参考

[1]. Spring Cloud Circuit Breaker
[2]. resilience4j 官网
[3]. resilience4j 中文参考手册



http://www.ppmy.cn/embedded/29087.html

相关文章

Python中的类(Class)详解——新手指南

在Python编程中&#xff0c;类&#xff08;Class&#xff09;是一个非常重要的概念&#xff0c;它允许程序员创建自己的对象类型。这些对象类型可以包含数据&#xff08;称为属性&#xff09;和函数&#xff08;称为方法&#xff09;&#xff0c;它们定义了这些对象的行为。本文…

fdfs安装启动及性能优化

fsatDFS安装 1、使用 wget 命令下载压缩包&#xff0c;如果没有 wget 命令使用 yum 命令安装 yum install wget 2、下载 fastdfs wget -c “https://github.com/happyfish100/fastdfs/archive/V6.06.tar.gz” 3、下载 libfastcommon wget -c “https://github.com/happyfish10…

2023年蓝桥杯大学A组第二题:有奖问答(一维动态规划解法)

题目描述 小蓝正在参与一个现场问答的节目。 活动中一共有 30 道题目&#xff0c;每题只有答对和答错两种情况&#xff0c;每答对一题得 10 分&#xff0c;答错一题分数归零。 小蓝可以在任意时刻结束答题并获得目前分数对应的奖项&#xff0c;之后不能再答任何题目。 最高奖项…

微信小程序 - 登录(切屏后继续倒计时)

屏幕休眠或后台运行倒计时暂停问题 updateTime: function () {let promise new Promise((resolve, reject) > {var beginTime new Date().getTime();let setTimer setInterval(() > {var newTime new Date().getTime();var dTime (newTime - beginTime) / 1000;dTim…

Node私库Verdaccio使用记录,包的构建,推送和拉取

Node私库Verdaccio使用记录&#xff0c;包的构建&#xff0c;推送和拉取 Verdaccio是一个轻量级的私有npm代理注册中心&#xff0c;它可以帮助你在本地搭建一个npm仓库&#xff0c;非常适合企业内部使用。通过使用Verdaccio&#xff0c;你可以控制和缓存依赖包&#xff0c;提高…

c语言从入门到函数速成(1)

温馨提醒&#xff1a;本篇文章适合人群&#xff1a;刚学c又感觉那个地方不怎么懂的同学以及以及学了一些因为自身原因停学一段时间后又继续学c的同学 好&#xff0c;正片开始。 主函数 学c时最先学的是我们c语言程序的主体函数&#xff0c;c的主函数有两种写法&#xff0c;这…

速盾:什么是cdn架构

CDN&#xff08;Content Delivery Network&#xff09;即内容分发网络&#xff0c;是一种分布式的架构&#xff0c;用于提高互联网上的内容传输速度和用户体验。CDN架构通过将内容分发到全球多个节点&#xff0c;使用户能够从最近的节点获取内容&#xff0c;从而减少延迟和网络…

【上岗认证】错题整理记录

目录 &#x1f31e;一、阶段1&#xff1a;编码规范 &#x1f30a;编码规范考试-CC &#x1f31e;二、阶段2&#xff1a;开发基础 &#x1f30a;C/C &#x1f30a;数据库&#xff08;Oracle/MySql&#xff09; &#x1f31e;三、阶段3&#xff1a;测试基础 &#x1f30a;…