代码编织梦想

微服务设计模式 - 重试模式(Retry Pattern)

retry-in-microservice

定义

重试模式(Retry Pattern)是一种微服务中的设计模式,用于在临时性失败(如网络故障或暂时不可用的服务)发生时,自动重新尝试请求,而不是立即返回错误。通过重试,可以增加操作成功的概率,从而提高系统的可靠性。

结构

重试模式通常包括以下几个组件:

  • 调用者:发起请求的实体。
  • 操作:需要重试的操作,比如API调用或数据库操作。
  • 重试策略:定义重试次数、间隔时间和重试条件的策略。

工作原理

retry-pattern-flow

重试模式的工作原理如下:

  1. 调用者发起请求
  2. 执行操作,如果成功则返回结果,如果失败则进入重试策略。
  3. 重试策略检查是否满足重试条件,如最大重试次数未达到、错误类型允许重试等。
  4. 如果满足条件,则按照重试策略重新请求操作,否则返回最终失败结果。

优点

  1. 提高可靠性:在遇到暂时性故障时,通过重试机制增加操作成功的机会。

  2. 增强用户体验:避免频繁的错误提示,提高用户的满意度。

  3. 灵活性:通过配置不同的重试策略,适应不同的业务需求。

使用场景

重试模式(Retry Pattern)在很多场景中非常有用,尤其是在处理临时性故障(transient faults)的时候。下面列举了几种典型的使用场景:

  1. 网络通信问题
    • 网络抖动:在面临暂时性网络抖动或不稳定时,重试可以帮助确保请求成功。
    • 网络超时:一些网络请求可能超时,如果这些超时是临时的,那么可以通过重试来解决问题。
  2. 外部API调用
    • 第三方服务不稳定:在调用外部API或第三方服务时,如果这些服务偶尔不稳定,通过重试可以增加成功的概率。
    • API限流:外部API可能会对请求数量进行限流,导致部分请求被拒绝,重试可以在稍后的时间段重新发送请求。
  3. 数据库操作
    • 数据库连接中断:数据库连接可能偶尔中断,通过重试机制可以重新建立连接。
    • 锁定结果:在高并发情况下,某些数据库操作可能会因行锁或表锁被暂时阻塞,通过重试可以等待锁释放。
  4. 消息队列
    • 消息消费失败:在处理消息队列中的消息时,如果某些消息因临时性问题处理失败,可以通过重试机制重新处理这些消息。
  5. 分布式系统
    • 服务依赖:在分布式系统中,多个微服务之间相互依赖,如果某个服务临时不可用,通过重试可以确保请求最终成功。
  6. 其他临时性错误
    • 资源限制:某些临时性资源限制(如内存不足或CPU过载)可能导致操作失败,通过重试可以等待资源恢复。
    • 维护或升级:某些服务可能在维护或升级过程中短暂不可用,重试机制可以在服务恢复后继续尝试请求。

影响因素

在实现重试模式时,我们需要考虑多个重要因素,包括幂等性(Idempotency)、事务一致性(Transaction Consistency)、性能影响和异常类型,以确保系统的可靠性和有效性。

以下具体介绍每一个影响因素,并以SrpingBoot相关代码,以及resilience4j(用以实现重试模式)相关配置进行辅助说明。

幂等性(Idempotency)

定义:幂等性是指在相同条件下多次执行操作,结果应保持一致。换句话说,幂等操作在被执行一次或多次后对系统的状态产生相同的影响。

重要性:重试模式通常会多次执行相同操作,因此确保操作的幂等性是至关重要的。若操作不具有幂等性,可能会导致数据不一致或重复处理。

实现示例

  • 对于HTTP请求,可以使用HTTP动词来区分幂等操作。例如,PUT和DELETE通常为幂等操作,而POST可能不是。
  • 在数据库写操作时,添加唯一约束,或在应用层实现幂等逻辑。

示例代码 - 幂等性操作

@Service
public class IdempotentService {

    @Autowired
    private OrderRepository orderRepository;

    @Retry(name = "idempotentService", fallbackMethod = "fallback")
    public String createOrder(Order order) {
        // 检查订单是否已经存在(即幂等性检查)
        Optional<Order> existingOrder = orderRepository.findByOrderId(order.getOrderId());
        if (existingOrder.isPresent()) {
            return "Order already exists";
        }

        // 创建新订单
        orderRepository.save(order);
        return "Order created successfully";
    }

    private String fallback(Order order, Exception e) {
        return "Fallback response";
    }
}

事务一致性(Transaction Consistency)

定义:事务一致性确保在一组操作中,所有操作要么全部成功,要么全部失败,从而保证系统状态的一致性。

挑战:重试机制可能跨越多个事务,且每次重试都应当考虑事务的一致性问题。未能维护一致性可能导致数据混乱或部分提交的问题。

实现示例

  • 在Java中使用Spring的@Transactional注解来管理事务一致性。
  • 在分布式系统中,使用2PC(两阶段提交)或Saga模式等事务管理策略。

示例代码 - 事务一致性

@Service
public class TransactionalService {

    @Autowired
    private OrderRepository orderRepository;

    @Transactional
    @Retry(name = "transactionalService", fallbackMethod = "fallback")
    public String createOrderTransactional(Order order) {
        // 创建新订单
        orderRepository.save(order);

        // 下单后其他相关操作...

        return "Order created successfully with transaction";
    }

    private String fallback(Order order, Exception e) {
        return "Fallback response in transaction";
    }
}

性能影响(Impact on Performance)

定义:重试机制可能引入额外的延迟和资源消耗,因此需要谨慎管理以减少性能影响。

优化策略

  • 限次数:限制重试次数,避免无限重试。
  • 指数退避:每次重试时增加等待时间,减少系统负载。
  • 快速失败:在明显不可恢复的情况下,尽早返回错误而不是反复重试。

实现示例

  • 配置如maxAttemptswaitDuration等参数来控制重试策略。

示例配置 - 性能相关

resilience4j.retry:
  instances:
    myService:
      max-attempts: 3
      wait-duration: 500ms
      max-wait-duration: 2s
      exponential-backoff:
        multiplier: 2

异常类型(Exception Type)

定义:不同类型的异常可能需要不同的重试策略。有些异常是暂时性的,可以通过重试解决;另一些则是不可恢复的,不应重试。

实现示例

  • 使用防御性编程和异常分类来确定哪些异常应该触发重试。
  • 自定义重试规则来处理不同类型的异常。

示例代码 - 异常类型识别

@Service
public class ExceptionHandlingService {

    @Retry(name = "exceptionHandlingService", fallbackMethod = "fallback", retryExceptions = {
            TemporaryException.class }, ignoreExceptions = { PermanentException.class })
    public String handleService() {
        // 假设某操作可能抛出TemporaryException或PermanentException
        riskyOperation();
        return "Operation completed";
    }

    private void riskyOperation() throws TemporaryException, PermanentException {
        // 实现一些逻辑,可能抛出不同类型的异常
    }

    private String fallback(Exception e) {
        return "Fallback response for exceptions";
    }
}

重试策略

在实现重试模式时,选择合适的重试策略(Retry Strategy)是至关重要的。不同的重试策略会影响系统的可靠性、性能和响应时间。以下是常见的重试策略:

固定间隔重试(Fixed Interval Retry)

定义:固定间隔重试策略在每次重试之间使用相同的时间间隔。例如,重试每次间隔500毫秒。

优点:实现简单,适用于简单的重试场景。

缺点:在高负载或问题持续存在的情况下,可能会导致系统过载。

示例配置

resilience4j.retry:
  instances:
    myService:
      max-attempts: 3
      wait-duration: 500ms

指数退避重试(Exponential Backoff Retry)

定义:每次重试时,等待时间逐步增加。例如,第一次重试后等待500毫秒,第二次重试后等待1秒,第三次重试后等待2秒,以此类推。

优点:逐步增加的等待时间可以有效减少系统负载,适用于网络抖动或外部服务不稳定的情形。

缺点:实现稍微复杂,可能导致较长的重试时间。

示例配置

resilience4j.retry:
  instances:
    myService:
      max-attempts: 3
      wait-duration: 500ms
      exponential-backoff:
        multiplier: 2

抛出异常后退避重试(Backoff with Jitter Retry)

定义:在指数退避的基础上,加入随机时间间隔(称为“抖动”),以避免重试请求出现峰值。

优点:通过在重试间隔中加入随机性,进一步减少了系统因重试请求同时发出的风险,适用于高并发场景。

缺点:实现复杂度更高。

示例代码(Java示例):

RetryConfig config = RetryConfig.custom()
  .maxAttempts(3)
  .waitDuration(Duration.ofMillis(500))
  .retryOnException(throwable -> throwable instanceof TemporaryException)
  .intervalFunction(IntervalFunction.ofExponentialBackoff(500, 2).withRandomizedWait())
  .build();

增量退避重试(Incremental Backoff Retry)

定义:每次重试等待时间按照固定的增量增加。例如,第一次重试后等待500毫秒,第二次重试后等待1秒,第三次重试后等待1.5秒。

优点:控制每次重试的等待时间增加量,简单易理解。

缺点:在一定情况下,性能可能不如指数退避策略。

示例代码

resilience4j.retry:
  instances:
    myService:
      max-attempts: 3
      wait-duration: 500ms
      interval-function:
        increment-interval:
          interval: 500ms

固定次数重试(Retry with Max Attempts)

定义:限制重试的次数,当超过重试次数时停止重试。

优点:防止过多重试导致资源消耗,保护系统稳定。

缺点:可能导致在某些情况下无效重试。

示例代码

resilience4j.retry:
  instances:
    myService:
      max-attempts: 5
      wait-duration: 500ms

自定义重试策略(Custom Retry Strategy)

定义:根据特定的业务需求和场景,设计定制化的重试策略。

优点:灵活、满足特定需求。

缺点:需要更多的开发和测试工作。

示例代码(Java自定义实现):

RetryConfig config = RetryConfig.custom()
  .maxAttempts(5)
  .intervalFunction(IntervalFunction.of(Duration.ofMillis(500), IntervalFunction.of(Random::nextGaussian)))
  .retryOnException(throwable -> {
      // Define your custom retry condition here.
      return throwable instanceof TemporaryException;
  })
  .build();

综合以上,在选择重试策略时,建议如下:

  1. 分析场景:根据实际业务场景选择合适的重试策略。例如,网络波动适合使用指数退避重试。
  2. 测试不同策略:通过负载测试和性能测试,评估不同重试策略对系统的实际影响。
  3. 结合多种策略:可以组合多个重试策略,例如固定次数重试加上指数退避,满足更复杂的需求。
  4. 监控与调整:定期监控重试机制的效果,根据实际情况动态调整重试策略。

完整实例代码

这个示例展示了如何在Spring Boot应用中使用Resilience4j实现重试模式。配置文件中定义了重试策略,包括最大尝试次数、等待时间和指数退避参数。服务层通过重试注解@Retry实现重试逻辑,并在错误情况下调用回退方法。通过这一模式,系统可以有效应对各种临时性故障,提高整体的可靠性和稳定性。

项目结构

.
├── src/
│   ├── main/
│   │   ├── java/
│   │   │   └── com/
│   │   │       └── example/
│   │   │           └── retry/
│   │   │               ├── RetryApplication.java
│   │   │               ├── controller/
│   │   │               │   └── RetryController.java
│   │   │               ├── service/
│   │   │               │   └── RetryService.java
│   │   │               └── exception/
│   │   │                   ├── TemporaryException.java
│   │   │                   └── PermanentException.java
│   │   ├── resources/
│   │   │   ├── application.yaml
└── pom.xml

Maven 依赖

首先,在Maven的pom.xml文件中添加Resilience4j依赖项:

<dependencies>
    <!-- Spring Boot dependencies -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>

    <!-- Resilience4j dependencies -->
    <dependency>
        <groupId>io.github.resilience4j</groupId>
        <artifactId>resilience4j-spring-boot2</artifactId>
        <version>1.7.1</version>
    </dependency>
    <dependency>
        <groupId>io.github.resilience4j</groupId>
        <artifactId>resilience4j-retry</artifactId>
        <version>1.7.1</version>
    </dependency>
</dependencies>

Retry配置

在Spring Boot应用程序的配置文件application.yaml中配置Resilience4j的重试策略:

resilience4j.retry:
  instances:
    myService:
      max-attempts: 5
      wait-duration: 500ms
      exponential-backoff:
        multiplier: 2
      retry-exceptions:
        - com.example.retry.exception.TemporaryException
      ignore-exceptions:
        - com.example.retry.exception.PermanentException

代码说明

RetryApplication.java

主应用程序文件:

package com.example.retry;

import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;

@SpringBootApplication
public class RetryApplication {
    public static void main(String[] args) {
        SpringApplication.run(RetryApplication.class, args);
    }
}
RetryController.java

控制器类:

package com.example.retry.controller;

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.http.ResponseEntity;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;

import com.example.retry.service.RetryService;

@RestController
public class RetryController {

    @Autowired
    private RetryService retryService;

    @GetMapping("/retry-test")
    public ResponseEntity<String> retryTest() {
        return ResponseEntity.ok(retryService.callExternalService());
    }
}
RetryService.java

服务层实现重试逻辑:

package com.example.retry.service;

import org.springframework.stereotype.Service;
import io.github.resilience4j.retry.annotation.Retry;
import com.example.retry.exception.TemporaryException;
import com.example.retry.exception.PermanentException;

@Service
public class RetryService {

    @Retry(name = "myService", fallbackMethod = "fallback")
    public String callExternalService() throws TemporaryException, PermanentException {
        // 模拟外部服务调用
        double random = Math.random();
        if (random < 0.5) {
            throw new TemporaryException("Temporary issue occurred");
        } else if (random < 0.8) {
            throw new PermanentException("Permanent issue occurred");
        }
        return "Success";
    }

    private String fallback(Exception e) {
        return "Fallback response: " + e.getMessage();
    }
}
TemporaryException.java

自定义临时异常类型:

package com.example.retry.exception;

public class TemporaryException extends Exception {
    public TemporaryException(String message) {
        super(message);
    }
}
PermanentException.java

自定义永久异常类型:

package com.example.retry.exception;

public class PermanentException extends Exception {
    public PermanentException(String message) {
        super(message);
    }
}

类序列图

retry-pattern-class

运行测试

运行Spring Boot应用程序后,访问 http://localhost:8080/retry-test 可以触发重试逻辑。根据随机数的不同,有时会成功,有时会触发临时异常进行重试,如果次数用尽则返回回退响应。

总结

Robert-C-Martin-Quote-Software-has-two-types-of-value-the-value-of

在云计算和微服务架构中,重试模式是一种重要的设计模式,通过处理暂时性故障来增强系统的可靠性。当实现重试模式时,必须考虑幂等性、事务一致性、性能影响和异常类型,以确保系统的整体稳定性和正确性。Resilience4j库提供了实现重试模式的便利方法,通过合理配置可以满足各种不同的业务需求。希望本文能帮助您更好地理解和选择合适的重试策略,为系统设计和实现提供参考。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/2404_88048702/article/details/143318486

避免大规模故障的微服务架构_xushuai110的博客-爱代码爱编程

微服务架构通过一种良好的服务边界划分,能够有效地进行故障隔离。但就像其他分布式系统一样,在网络、硬件或者应用级别上容易出现问题的机率会更高。服务的依赖关系,导致在任何组件暂时不可用的情况下,就它们的消费者而言都是可以接受的。

微服务api网关_微服务设计api网关模式-爱代码爱编程

微服务api网关 重点 (Top highlight) According to the definition by Gartner: “Microservice is a tightly scoped, strongly encapsula

重试设计:超时时间和重试次数怎么设置比较合理-爱代码爱编程

当我们把单体应用微服务化,本来一个进程内的函数调用就成了远程调用,这样就会涉及到网络上的问题。网络上有很多各式各样的组件,如:DNS服务、网卡、交换机、路由器、负载均衡等设备,这些设备都不一定是稳定的,在设计传输的整个过程中,只要一个环节出了问题,那么都会导致问题。 所以我们需要一个重试的机制。但是,我们需要明白的是,“重试”的语义是我们认为这个故障时暂时

springcloud alibaba【微服务分布式组件---gateway】_naijia_ovo的博客-爱代码爱编程

目录 7. SpringCloud 微服务网关Gateway组件7.1 什么是SpringCloud Gateway7.1.1 核心概念7.1.2 工作原理7.2 SpringCloud Gateway 快速开始7.3 Gateway---整合 Nacos7.4 Gateway---内置路由断言工厂7.4.1 路由断言工厂(Route Predic

微服务 spring-cloud-alibaba简单笔记-爱代码爱编程

Nacos Nacos体系架构 领域模型 Nacos 领域模型描述了服务与实例之间的边界和层级关系。Nacos 的服务领域模型是以“服 务”为维度构建起来的,这个服务并不是指集群中的单个服务器,而是指微服务的服务名。

【微服务核心笔记】-爱代码爱编程

一、注册中心、配置管理 Nacos Alibaba Nacos,服务提供者和服务消费者将自己的信息注册到注册中心,注册中心通过心跳机制来确保每个服务都可以正常运行,服务消费者订阅注册中心,注册中心为服务消费者推送变更

微服务之网关-爱代码爱编程

认识网关 前端请求不能直接访问微服务,而是要请求网关: 网关可以做安全控制,也就是登录身份校验,校验通过才放行通过认证后,网关再根据请求判断应该访问哪个微服务,将请求转发过去 在SpringCloud当中,提供了两种网

微服务之sentinel概念介绍及项目实战代码-爱代码爱编程

1.微服务容错方案介绍 限流漏斗:不管流量多大,均匀的流入容器,令牌桶算法,漏桶算法熔断:保险丝,熔断服务,为了防止整个系统故障,包含当前和下游服务降级:抛弃一些非核心的接口和数据,返回兜底数据隔离:服务和资源互相隔离,比

【微服务】nacos 注册中心-爱代码爱编程

<!-- nacos 依赖--> <dependency> <groupId>com.alibaba.cloud</groupId> <artifactId>spring-cloud-alibaba-dependencies</artifactId>

系统设计|12 个微服务设计模式分享(译文)_微服务 bulkhead-爱代码爱编程

Unleash the Power of Microservices 释放微服务的力量 Are you striving to build efficient, scalable, and resilient sof

微服务网关全能进化:设计模式加持下的spring cloud alibaba落地实践(三)-爱代码爱编程

时间:2024年09月11日 作者:小蒋聊技术 邮箱:wei_wei10@163.com 微信:wei_wei10 音频:喜马拉雅 希望大家帮个忙!如果大家有工作机会,希望帮小蒋推荐一下,小蒋希望遇到一个认真做事的团队,一起努力。需要简历可以加我微信。 大家好,欢迎来到小蒋聊技术,小蒋准备和大家一起聊聊技术的那些事。 今天小蒋

使用docker compose简化微服务部署-爱代码爱编程

文章目录 Docker Compose简介安装Docker Compose在Windows上安装Docker Compose在macOS上安装Docker Compose在Linux上安装Docker Comp