微服务设计模式 - 重试模式(Retry Pattern)

news/2024/10/30 6:36:40/

微服务设计模式 - 重试模式(Retry Pattern)

retry-in-microservice

定义

重试模式(Retry Pattern)是一种微服务中的设计模式,用于在临时性失败(如网络故障或暂时不可用的服务)发生时,自动重新尝试请求,而不是立即返回错误。通过重试,可以增加操作成功的概率,从而提高系统的可靠性。

结构

重试模式通常包括以下几个组件:

  • 调用者:发起请求的实体。
  • 操作:需要重试的操作,比如API调用或数据库操作。
  • 重试策略:定义重试次数、间隔时间和重试条件的策略。

工作原理

retry-pattern-flow

重试模式的工作原理如下:

  1. 调用者发起请求
  2. 执行操作,如果成功则返回结果,如果失败则进入重试策略。
  3. 重试策略检查是否满足重试条件,如最大重试次数未达到、错误类型允许重试等。
  4. 如果满足条件,则按照重试策略重新请求操作,否则返回最终失败结果。

优点

  1. 提高可靠性:在遇到暂时性故障时,通过重试机制增加操作成功的机会。

  2. 增强用户体验:避免频繁的错误提示,提高用户的满意度。

  3. 灵活性:通过配置不同的重试策略,适应不同的业务需求。

使用场景

重试模式(Retry Pattern)在很多场景中非常有用,尤其是在处理临时性故障(transient faults)的时候。下面列举了几种典型的使用场景:

  1. 网络通信问题
    • 网络抖动:在面临暂时性网络抖动或不稳定时,重试可以帮助确保请求成功。
    • 网络超时:一些网络请求可能超时,如果这些超时是临时的,那么可以通过重试来解决问题。
  2. 外部API调用
    • 第三方服务不稳定:在调用外部API或第三方服务时,如果这些服务偶尔不稳定,通过重试可以增加成功的概率。
    • API限流:外部API可能会对请求数量进行限流,导致部分请求被拒绝,重试可以在稍后的时间段重新发送请求。
  3. 数据库操作
    • 数据库连接中断:数据库连接可能偶尔中断,通过重试机制可以重新建立连接。
    • 锁定结果:在高并发情况下,某些数据库操作可能会因行锁或表锁被暂时阻塞,通过重试可以等待锁释放。
  4. 消息队列
    • 消息消费失败:在处理消息队列中的消息时,如果某些消息因临时性问题处理失败,可以通过重试机制重新处理这些消息。
  5. 分布式系统
    • 服务依赖:在分布式系统中,多个微服务之间相互依赖,如果某个服务临时不可用,通过重试可以确保请求最终成功。
  6. 其他临时性错误
    • 资源限制:某些临时性资源限制(如内存不足或CPU过载)可能导致操作失败,通过重试可以等待资源恢复。
    • 维护或升级:某些服务可能在维护或升级过程中短暂不可用,重试机制可以在服务恢复后继续尝试请求。

影响因素

在实现重试模式时,我们需要考虑多个重要因素,包括幂等性(Idempotency)、事务一致性(Transaction Consistency)、性能影响和异常类型,以确保系统的可靠性和有效性。

以下具体介绍每一个影响因素,并以SrpingBoot相关代码,以及resilience4j(用以实现重试模式)相关配置进行辅助说明。

幂等性(Idempotency)

定义:幂等性是指在相同条件下多次执行操作,结果应保持一致。换句话说,幂等操作在被执行一次或多次后对系统的状态产生相同的影响。

重要性:重试模式通常会多次执行相同操作,因此确保操作的幂等性是至关重要的。若操作不具有幂等性,可能会导致数据不一致或重复处理。

实现示例

  • 对于HTTP请求,可以使用HTTP动词来区分幂等操作。例如,PUT和DELETE通常为幂等操作,而POST可能不是。
  • 在数据库写操作时,添加唯一约束,或在应用层实现幂等逻辑。

示例代码 - 幂等性操作

java">@Service
public class IdempotentService {@Autowiredprivate OrderRepository orderRepository;@Retry(name = "idempotentService", fallbackMethod = "fallback")public String createOrder(Order order) {// 检查订单是否已经存在(即幂等性检查)Optional<Order> existingOrder = orderRepository.findByOrderId(order.getOrderId());if (existingOrder.isPresent()) {return "Order already exists";}// 创建新订单orderRepository.save(order);return "Order created successfully";}private String fallback(Order order, Exception e) {return "Fallback response";}
}

事务一致性(Transaction Consistency)

定义:事务一致性确保在一组操作中,所有操作要么全部成功,要么全部失败,从而保证系统状态的一致性。

挑战:重试机制可能跨越多个事务,且每次重试都应当考虑事务的一致性问题。未能维护一致性可能导致数据混乱或部分提交的问题。

实现示例

  • 在Java中使用Spring的@Transactional注解来管理事务一致性。
  • 在分布式系统中,使用2PC(两阶段提交)或Saga模式等事务管理策略。

示例代码 - 事务一致性

java">@Service
public class TransactionalService {@Autowiredprivate OrderRepository orderRepository;@Transactional@Retry(name = "transactionalService", fallbackMethod = "fallback")public String createOrderTransactional(Order order) {// 创建新订单orderRepository.save(order);// 下单后其他相关操作...return "Order created successfully with transaction";}private String fallback(Order order, Exception e) {return "Fallback response in transaction";}
}

性能影响(Impact on Performance)

定义:重试机制可能引入额外的延迟和资源消耗,因此需要谨慎管理以减少性能影响。

优化策略

  • 限次数:限制重试次数,避免无限重试。
  • 指数退避:每次重试时增加等待时间,减少系统负载。
  • 快速失败:在明显不可恢复的情况下,尽早返回错误而不是反复重试。

实现示例

  • 配置如maxAttemptswaitDuration等参数来控制重试策略。

示例配置 - 性能相关

resilience4j.retry:instances:myService:max-attempts: 3wait-duration: 500msmax-wait-duration: 2sexponential-backoff:multiplier: 2

异常类型(Exception Type)

定义:不同类型的异常可能需要不同的重试策略。有些异常是暂时性的,可以通过重试解决;另一些则是不可恢复的,不应重试。

实现示例

  • 使用防御性编程和异常分类来确定哪些异常应该触发重试。
  • 自定义重试规则来处理不同类型的异常。

示例代码 - 异常类型识别

java">@Service
public class ExceptionHandlingService {@Retry(name = "exceptionHandlingService", fallbackMethod = "fallback", retryExceptions = {TemporaryException.class }, ignoreExceptions = { PermanentException.class })public String handleService() {// 假设某操作可能抛出TemporaryException或PermanentExceptionriskyOperation();return "Operation completed";}private void riskyOperation() throws TemporaryException, PermanentException {// 实现一些逻辑,可能抛出不同类型的异常}private String fallback(Exception e) {return "Fallback response for exceptions";}
}

重试策略

在实现重试模式时,选择合适的重试策略(Retry Strategy)是至关重要的。不同的重试策略会影响系统的可靠性、性能和响应时间。以下是常见的重试策略:

固定间隔重试(Fixed Interval Retry)

定义:固定间隔重试策略在每次重试之间使用相同的时间间隔。例如,重试每次间隔500毫秒。

优点:实现简单,适用于简单的重试场景。

缺点:在高负载或问题持续存在的情况下,可能会导致系统过载。

示例配置

resilience4j.retry:instances:myService:max-attempts: 3wait-duration: 500ms

指数退避重试(Exponential Backoff Retry)

定义:每次重试时,等待时间逐步增加。例如,第一次重试后等待500毫秒,第二次重试后等待1秒,第三次重试后等待2秒,以此类推。

优点:逐步增加的等待时间可以有效减少系统负载,适用于网络抖动或外部服务不稳定的情形。

缺点:实现稍微复杂,可能导致较长的重试时间。

示例配置

resilience4j.retry:instances:myService:max-attempts: 3wait-duration: 500msexponential-backoff:multiplier: 2

抛出异常后退避重试(Backoff with Jitter Retry)

定义:在指数退避的基础上,加入随机时间间隔(称为“抖动”),以避免重试请求出现峰值。

优点:通过在重试间隔中加入随机性,进一步减少了系统因重试请求同时发出的风险,适用于高并发场景。

缺点:实现复杂度更高。

示例代码(Java示例):

java">RetryConfig config = RetryConfig.custom().maxAttempts(3).waitDuration(Duration.ofMillis(500)).retryOnException(throwable -> throwable instanceof TemporaryException).intervalFunction(IntervalFunction.ofExponentialBackoff(500, 2).withRandomizedWait()).build();

增量退避重试(Incremental Backoff Retry)

定义:每次重试等待时间按照固定的增量增加。例如,第一次重试后等待500毫秒,第二次重试后等待1秒,第三次重试后等待1.5秒。

优点:控制每次重试的等待时间增加量,简单易理解。

缺点:在一定情况下,性能可能不如指数退避策略。

示例代码

resilience4j.retry:instances:myService:max-attempts: 3wait-duration: 500msinterval-function:increment-interval:interval: 500ms

固定次数重试(Retry with Max Attempts)

定义:限制重试的次数,当超过重试次数时停止重试。

优点:防止过多重试导致资源消耗,保护系统稳定。

缺点:可能导致在某些情况下无效重试。

示例代码

resilience4j.retry:instances:myService:max-attempts: 5wait-duration: 500ms

自定义重试策略(Custom Retry Strategy)

定义:根据特定的业务需求和场景,设计定制化的重试策略。

优点:灵活、满足特定需求。

缺点:需要更多的开发和测试工作。

示例代码(Java自定义实现):

java">RetryConfig config = RetryConfig.custom().maxAttempts(5).intervalFunction(IntervalFunction.of(Duration.ofMillis(500), IntervalFunction.of(Random::nextGaussian))).retryOnException(throwable -> {// Define your custom retry condition here.return throwable instanceof TemporaryException;}).build();

综合以上,在选择重试策略时,建议如下:

  1. 分析场景:根据实际业务场景选择合适的重试策略。例如,网络波动适合使用指数退避重试。
  2. 测试不同策略:通过负载测试和性能测试,评估不同重试策略对系统的实际影响。
  3. 结合多种策略:可以组合多个重试策略,例如固定次数重试加上指数退避,满足更复杂的需求。
  4. 监控与调整:定期监控重试机制的效果,根据实际情况动态调整重试策略。

完整实例代码

这个示例展示了如何在Spring Boot应用中使用Resilience4j实现重试模式。配置文件中定义了重试策略,包括最大尝试次数、等待时间和指数退避参数。服务层通过重试注解@Retry实现重试逻辑,并在错误情况下调用回退方法。通过这一模式,系统可以有效应对各种临时性故障,提高整体的可靠性和稳定性。

项目结构

.
├── src/
│   ├── main/
│   │   ├── java/
│   │   │   └── com/
│   │   │       └── example/
│   │   │           └── retry/
│   │   │               ├── RetryApplication.java
│   │   │               ├── controller/
│   │   │               │   └── RetryController.java
│   │   │               ├── service/
│   │   │               │   └── RetryService.java
│   │   │               └── exception/
│   │   │                   ├── TemporaryException.java
│   │   │                   └── PermanentException.java
│   │   ├── resources/
│   │   │   ├── application.yaml
└── pom.xml

Maven 依赖

首先,在Maven的pom.xml文件中添加Resilience4j依赖项:

<dependencies><!-- Spring Boot dependencies --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><!-- Resilience4j dependencies --><dependency><groupId>io.github.resilience4j</groupId><artifactId>resilience4j-spring-boot2</artifactId><version>1.7.1</version></dependency><dependency><groupId>io.github.resilience4j</groupId><artifactId>resilience4j-retry</artifactId><version>1.7.1</version></dependency>
</dependencies>

Retry配置

在Spring Boot应用程序的配置文件application.yaml中配置Resilience4j的重试策略:

resilience4j.retry:instances:myService:max-attempts: 5wait-duration: 500msexponential-backoff:multiplier: 2retry-exceptions:- com.example.retry.exception.TemporaryExceptionignore-exceptions:- com.example.retry.exception.PermanentException

代码说明

java_434">RetryApplication.java

主应用程序文件:

java">package com.example.retry;import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;@SpringBootApplication
public class RetryApplication {public static void main(String[] args) {SpringApplication.run(RetryApplication.class, args);}
}
java_452">RetryController.java

控制器类:

java">package com.example.retry.controller;import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.http.ResponseEntity;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;import com.example.retry.service.RetryService;@RestController
public class RetryController {@Autowiredprivate RetryService retryService;@GetMapping("/retry-test")public ResponseEntity<String> retryTest() {return ResponseEntity.ok(retryService.callExternalService());}
}
java_479">RetryService.java

服务层实现重试逻辑:

java">package com.example.retry.service;import org.springframework.stereotype.Service;
import io.github.resilience4j.retry.annotation.Retry;
import com.example.retry.exception.TemporaryException;
import com.example.retry.exception.PermanentException;@Service
public class RetryService {@Retry(name = "myService", fallbackMethod = "fallback")public String callExternalService() throws TemporaryException, PermanentException {// 模拟外部服务调用double random = Math.random();if (random < 0.5) {throw new TemporaryException("Temporary issue occurred");} else if (random < 0.8) {throw new PermanentException("Permanent issue occurred");}return "Success";}private String fallback(Exception e) {return "Fallback response: " + e.getMessage();}
}
java_512">TemporaryException.java

自定义临时异常类型:

java">package com.example.retry.exception;public class TemporaryException extends Exception {public TemporaryException(String message) {super(message);}
}
java_526">PermanentException.java

自定义永久异常类型:

java">package com.example.retry.exception;public class PermanentException extends Exception {public PermanentException(String message) {super(message);}
}

类序列图

retry-pattern-class

运行测试

运行Spring Boot应用程序后,访问 http://localhost:8080/retry-test 可以触发重试逻辑。根据随机数的不同,有时会成功,有时会触发临时异常进行重试,如果次数用尽则返回回退响应。

总结

Robert-C-Martin-Quote-Software-has-two-types-of-value-the-value-of

在云计算和微服务架构中,重试模式是一种重要的设计模式,通过处理暂时性故障来增强系统的可靠性。当实现重试模式时,必须考虑幂等性、事务一致性、性能影响和异常类型,以确保系统的整体稳定性和正确性。Resilience4j库提供了实现重试模式的便利方法,通过合理配置可以满足各种不同的业务需求。希望本文能帮助您更好地理解重试模式及其在实际应用中的应用。希望本文能帮助您更好地理解和选择合适的重试策略,为系统的设计和实现提供参考。

参考链接

  • 重试模式 - 微软 Azure 官方文档
  • 重试设计模式 - Java 设计模式

http://www.ppmy.cn/news/1543023.html

相关文章

Depcheck——专门用于检测 JavaScript 和 Node.js 项目中未使用依赖项的工具

文章目录 Depcheck 是什麽核心功能&#x1f4da;检测未使用的依赖&#x1f41b;检测缺失的依赖✨支持多种文件类型&#x1f30d;可扩展性 安装与使用1. 安装 Depcheck2. 使用 Depcheck Depcheck 的应用总结项目源码&#xff1a; Depcheck 是什麽 来看一个常见错误场景&#x1…

[实时计算flink]使用Python依赖

您可以在Flink Python作业中使用自定义的Python虚拟环境、第三方Python包、JAR包和数据文件等&#xff0c;本文为您介绍如何在Python作业中使用这些依赖。 使用自定义的Python虚拟环境 说明 VVR 4.x仅支持3.7版本的Python虚拟环境&#xff0c;VVR 6.x及以上的版本无此限制&a…

【Eclipse系列】Eclipse版本与jdk对应版本

Eclipse版本和JDK版本对应关系&#xff1a;Eclipse/Installation - Eclipsepedia 以下为整理内容&#xff1a; 版本代号平台版本版本发行期需要的JDK最低版本Callisto3.22006-6-26JDK1.4Europa3.32007-6-27JDK1.5Ganymede3.42008-6-25JDK1.5Galileo3.52009-6-24JDK1.5Helios3.6…

为什么音频采样率通常是44.1kHz?

计算机中操作和存储只能是类似10101011这样的二进制数字&#xff0c;对于自然界中音频原始信号则为模拟信号&#xff0c;如下一个1kHz的音频信号&#xff0c;如果要转化为数字音频信号&#xff0c;则需要采样&#xff0c; 通常我们会采用44.1kHz的频率来进行采样&#xff0c;在…

Bash、sh 和 Shell都弄混了?

在Linux和Unix系统中&#xff0c;Bash、sh 和 Shell 都与命令行解释器相关&#xff0c;但它们各自的含义和作用略有不同。以下是它们之间的关系和区别&#xff1a; Shell Shell 是一个通用术语&#xff0c;指的是操作系统中负责解释和执行用户命令的程序。它是用户与操作系统…

ERC论文阅读(03)--SPCL论文阅读笔记(2024-10-29)

SPCL论文阅读笔记 论文中心思想 这篇论文是研究ERC任务的论文&#xff0c;作者提出了监督原型对比学习的方法用于ERC任务。 论文 EMNLP2022 paper “Supervised Prototypical Contrastive Learning for Emotion Recognition in Conversation” 现存问题 现存的使用监督对…

【HarmonyOS】判断应用是否已安装

【HarmonyOS】判断应用是否已安装 前言 在鸿蒙中判断应用是否已安全&#xff0c;只是通过包名是无法判断应用安装与否。在鸿蒙里新增了一种判断应用安装的工具方法&#xff0c;即&#xff1a;canOpenLink。 使用该工具函数的前提是&#xff0c;本应用配置了查询标签querySch…

从零开始的 vue项目部署到服务器详细步骤(vue项目build打包+nginx部署+配置ssl证书)

从零开始的 vue项目部署到服务器详细步骤&#xff08;vue项目build打包nginx部署配置ssl证书&#xff09; 文章目录 从零开始的 vue项目部署到服务器详细步骤&#xff08;vue项目build打包nginx部署配置ssl证书&#xff09;一、前言二、vue项目部署前配置1、vite.config.js 增加…