转载

Spring-retry使用指南原荐

Spring-retry

该项目为Spring应用程序提供声明式重试支持，它用于Spring Batch、Spring Integration、Apache Hadoop的Spring（以及其他），命令式重试也支持显式使用。

入门

声明式示例

@Configuration
@EnableRetry
public class Application {

    @Bean
    public Service service() {
        return new Service();
    }

}

@Service
class Service {
    @Retryable(RemoteAccessException.class)
    public void service() {
        // ... do something
    }
    @Recover
    public void recover(RemoteAccessException e) {
       // ... panic
    }
}

调用 service 方法，如果它由于 RemoteAccessException 失败，那么它将重试（默认情况下最多三次），如果继续失败，则执行 recover 方法， @Retryable 注解属性中有各种选项，用于包含和排除异常类型、限制重试次数和回退策略。

使用上面显示的 @Retryable 注解应用重试处理的声明式方法对AOP类有一个额外的运行时依赖，有关如何解决项目中的这种依赖关系的详细信息，请参阅下面的“重试代理的Java配置”部分。

命令式示例

RetryTemplate template = RetryTemplate.builder()
                .maxAttempts(3)
                .fixedBackoff(1000)
                .retryOn(RemoteAccessException.class)
                .build();

template.execute(ctx -> {
    // ... do something
});

旧版本：参见 RetryTemplate 部分中的示例。

构建

要求Java 1.7和Maven 3.0.5（或更高）。

$ mvn install

特性和API

RetryTemplate

为了使处理更健壮、更不容易失败，有时自动重试失败的操作会有所帮助，以防它在随后的尝试中可能成功，易受这种处理影响的错误本质上是暂时的。例如，对web服务或RMI服务的远程调用由于网络故障或数据库更新中的 DeadLockLoserException 而失败，可能在短时间的等待后自行解决，要自动化这些操作的重试， Spring Retry 具有 RetryOperations 策略， RetryOperations 接口看起来是这样的：

public interface RetryOperations {

    <T> T execute(RetryCallback<T> retryCallback) throws Exception;

    <T> T execute(RetryCallback<T> retryCallback, RecoveryCallback<T> recoveryCallback)
        throws Exception;

    <T> T execute(RetryCallback<T> retryCallback, RetryState retryState)
        throws Exception, ExhaustedRetryException;

    <T> T execute(RetryCallback<T> retryCallback, RecoveryCallback<T> recoveryCallback,
        RetryState retryState) throws Exception;

}

基本回调是一个简单的接口，允许你插入一些要重试的业务逻辑：

public interface RetryCallback<T> {

    T doWithRetry(RetryContext context) throws Throwable;

}

执行回调，如果它失败（通过抛出 Exception ），将重试它，直到成功或实现决定中止为止。 RetryOperations 接口中有许多重载的 execute 方法，它们处理各种用例，以便在所有重试尝试都耗尽时进行恢复，还有重试状态，这允许客户端和实现在调用之间存储信息（稍后将详细介绍）。

RetryOperations 最简单的通用实现是 RetryTemplate ，它可以这样用：

RetryTemplate template = new RetryTemplate();

TimeoutRetryPolicy policy = new TimeoutRetryPolicy();
policy.setTimeout(30000L);

template.setRetryPolicy(policy);

Foo result = template.execute(new RetryCallback<Foo>() {

    public Foo doWithRetry(RetryContext context) {
        // Do stuff that might fail, e.g. webservice operation
        return result;
    }

});

在本例中，我们执行一个web服务调用并将结果返回给用户，如果该调用失败，则重试该调用，直到达到超时为止。

从1.3版开始， RetryTemplate 的流畅配置也可用：

RetryTemplate.builder()
      .maxAttempts(10)
      .exponentialBackoff(100, 2, 10000)
      .retryOn(IOException.class)
      .traversingCauses()
      .build();
 
RetryTemplate.builder()
      .fixedBackoff(10)
      .withinMillis(3000)
      .build();
 
RetryTemplate.builder()
      .infiniteRetry()
      .retryOn(IOException.class)
      .uniformRandomBackoff(1000, 3000)
      .build();

RetryContext

RetryCallback 的方法参数是一个 RetryContext ，许多回调将简单地忽略上下文，但是如果需要，它可以作为一个属性包来存储迭代期间的数据。

如果同一个线程中正在进行嵌套重试，则 RetryContext 将具有父上下文，父上下文有时对于存储需要在执行的调用之间共享的数据很有用。

RecoveryCallback

当重试耗尽时， RetryOperations 可以将控制权传递给另一个回调 RecoveryCallback ，要使用此功能，客户端只需将回调函数一起传递给相同的方法，例如：

Foo foo = template.execute(new RetryCallback<Foo>() {
    public Foo doWithRetry(RetryContext context) {
        // business logic here
    },
  new RecoveryCallback<Foo>() {
    Foo recover(RetryContext context) throws Exception {
          // recover logic here
    }
});

如果在模板决定中止之前业务逻辑没有成功，那么客户端就有机会通过恢复回调执行一些替代处理。

无状态重试

在最简单的情况下，重试只是一个 while 循环， RetryTemplate 可以一直尝试，直到成功或失败。 RetryContext 包含一些状态来决定是重试还是中止，但是这个状态位于堆栈上，不需要将它存储在全局的任何位置，因此我们将此称为无状态重试。无状态重试和有状态重试之间的区别包含在 RetryPolicy 的实现中（ RetryTemplate 可以同时处理这两种情况），在无状态重试中，回调总是在重试失败时在同一个线程中执行。

有状态重试

如果失败导致事务性资源无效，则需要特别考虑，这并不适用于简单的远程调用，因为（通常）没有事务资源，但有时确实适用于数据库更新，尤其是在使用 Hibernate 时。在这种情况下，只有立即重新抛出调用失败的异常才有意义，以便事务可以回滚并启动一个新的有效的事务。

在这些情况下，无状态重试是不够的，因为重新抛出和回滚必然会离开 RetryOperations.execute() 方法，并可能丢失堆栈上的上下文。为了避免丢失它，我们必须引入一种存储策略，将它从堆栈中取出并（至少）放入堆存储中，为此， Spring Retry 提供了一种存储策略 RetryContextCache ，可以将其注入 RetryTemplate 。 RetryContextCache 的默认实现在内存中，使用一个简单的 Map ，它有一个严格执行的最大容量，以避免内存泄漏，但它没有任何高级缓存功能，如生存时间。如果需要，应该考虑注入具有这些特性的 Map ，在集群环境中对多个进程的高级使用可能还会考虑使用某种集群缓存实现 RetryContextCache （不过，即使在集群环境中，这也可能是多余的）。

RetryOperations 的部分职责是在失败的操作在新执行中返回时识别它们（通常封装在新事务中），为了促进这一点， Spring Retry 提供了 RetryState 抽象，这与 RetryOperations 中的特殊 execute 方法一起工作。

识别失败操作的方法是跨重试的多个调用标识状态，要标识状态，用户可以提供 RetryState 对象，该对象负责返回标识该项的唯一键，标识符用作 RetryContextCache 中的键。

在 RetryState 返回的键中实现 Object.equals() 和 Object.hashCode() 要非常小心，最好的建议是使用业务键来标识项，对于JMS消息，可以使用消息ID。

当重试耗尽时，还可以选择以另一种方式处理失败的项，而不是调用 RetryCallback （现在假定很可能会失败），就像在无状态的情况下一样，这个选项是由 RecoveryCallback 提供的，它可以通过将其传递给 RetryOperations 的 execute 方法来提供。

重试或不重试的决定实际上委托给了一个常规的 RetryPolicy ，因此可以在那里注入对限制和超时的常见关注（参见下面）。

重试策略

在 RetryTemplate 中， execute 方法中重试或失败的决定由 RetryPolicy 决定， RetryPolicy 也是 RetryContext 的工厂。 RetryTemplate 有责任使用当前策略创建 RetryContext ，并在每次尝试时将其传递给 RetryCallback 。回调失败后， RetryTemplate 必须调用 RetryPolicy 来要求它更新状态（该状态将存储在 RetryContext 中），然后它询问策略是否可以进行另一次尝试。如果无法进行另一次尝试（例如达到限制或检测到超时），则策略还负责标识耗尽状态，但不负责处理异常。 RetryTemplate 将抛出原始异常，除非在有状态的情况下，当没有可用的恢复，在这种情况下，它将抛出 RetryExhaustedException 。你还可以在RetryTemplate中设置一个标志，让它无条件地从回调（即从用户代码）抛出原始异常。

失败本质上要么是可重试的，要么是不可重试的 — 如果总是要从业务逻辑中抛出相同的异常，那么重试是没有帮助的。所以不要在所有异常类型上重试 — 试着只关注那些你希望可以重试的异常。更积极地重试通常不会对业务逻辑造成损害，但这是浪费，因为如果失败是确定的，那么重试一些预先知道是致命的东西就会花费时间。

Spring Retry 提供了一些无状态 RetryPolicy 的简单通用实现，例如 SimpleRetryPolicy 和上面示例中使用的 TimeoutRetryPolicy 。

SimpleRetryPolicy 只允许对指定的异常类型列表中的任何一种进行重试，最多可以重试固定次数：

// Set the max attempts including the initial attempt before retrying
// and retry on all exceptions (this is the default):
SimpleRetryPolicy policy = new SimpleRetryPolicy(5, Collections.singletonMap(Exception.class, true));

// Use the policy...
RetryTemplate template = new RetryTemplate();
template.setRetryPolicy(policy);
template.execute(new RetryCallback<Foo>() {
    public Foo doWithRetry(RetryContext context) {
        // business logic here
    }
});

还有一个更灵活的实现称为 ExceptionClassifierRetryPolicy ，它允许用户通过 ExceptionClassifier 抽象为任意一组异常类型配置不同的重试行为。策略的工作原理是调用分类器将异常转换为委托 RetryPolicy ，例如，通过将一种异常类型映射到另一种策略，可以在失败之前重试更多次。

用户可能需要实现自己的重试策略来进行更定制的决策，例如，如果有一个众所周知的、特定于解决方案的异常分类，则将其分为可重试和不可重试。

回退策略

在短暂故障之后重试时，在重试之前稍作等待通常会有所帮助，因为通常故障是由某些问题引起的，而这些问题只能通过等待来解决，如果 RetryCallback 失败， RetryTemplate 可以根据适当的 BackoffPolicy 暂停执行。

public interface BackoffPolicy {

    BackOffContext start(RetryContext context);

    void backOff(BackOffContext backOffContext)
        throws BackOffInterruptedException;

}

回退策略可以自由地以其选择的任何方式实现回退， Spring Retry 开箱即用提供的策略都使用 Thread.sleep() 。一个常见的用例是用指数级增长的等待时间来回退，以避免两次重试进入锁步，两次都失败 — 这是从以太网中学到的教训。为此， Spring Retry 提供了 ExponentialBackoffPolicy ，还有一些随机版本的延迟策略，对于避免在复杂系统中的相关故障之间产生共振非常有用。

监听器

对于跨多个不同重试的横切关注点，能够接收额外的回调通常是有用的，为此， Spring Retry 提供了 RetryListener 接口， RetryTemplate 允许用户注册 RetryListeners ，在迭代期间，他们将使用 RetryContext 获得回调，并在可用的地方使用 Throwable 。

接口是这样的：

public interface RetryListener {

    void open(RetryContext context, RetryCallback<T> callback);

    void onError(RetryContext context, RetryCallback<T> callback, Throwable e);

    void close(RetryContext context, RetryCallback<T> callback, Throwable e);
}

在最简单的情况下， open 和 close 回调出现在整个重试之前和之后， onError 应用于各个 RetryCallback 调用， close 方法也可能接收到一个 Throwable ，如果出现错误，则是 RetryCallback 抛出的最后一个错误。

注意，当有多个监听器时，它们位于列表中，因此有一个顺序，在这种情况下， open 将以相同的顺序调用，而 onError 和 close 将以相反的顺序调用。

用于反射方法调用的监听器

当处理用 @Retryable 注解的方法或用Spring AOP拦截的方法时， spring-retry 提供了在 RetryListener 实现中详细检查方法调用的可能性。

当需要监视某个方法调用被重试的频率并使用详细的标记信息（例如：类名、方法名，甚至在某些特殊情况下的参数值）公开它时，这种场景可能特别有用。

template.registerListener(new MethodInvocationRetryListenerSupport() {
      @Override
      protected <T, E extends Throwable> void doClose(RetryContext context,
          MethodInvocationRetryCallback<T, E> callback, Throwable throwable) {
        monitoringTags.put(labelTagName, callback.getLabel());
        Method method = callback.getInvocation()
            .getMethod();
        monitoringTags.put(classTagName,
            method.getDeclaringClass().getSimpleName());
        monitoringTags.put(methodTagName, method.getName());

        // register a monitoring counter with appropriate tags
        // ...
      }
    });

声明式重试

有时候，有些业务处理你知道每次发生时都要重试，这方面的经典示例是远程服务调用， Spring Retry 提供了一个AOP拦截器，它将方法调用封装在 RetryOperations 中正是出于这个目的。 RetryOperationsInterceptor 执行拦截方法，并根据所提供的 RetryTemplate 中的 RetryPolicy 在失败时重试。

用于重试代理的Java配置

将 @EnableRetry 注解添加到你的 @Configuration 类之一，并在要重试的方法（或所有方法的类型级别）上使用 @Retryable ，你还可以指定任意数量的重试监听器，例如：

@Configuration
@EnableRetry
public class Application {

    @Bean
    public Service service() {
        return new Service();
    }
    
    @Bean public RetryListener retryListener1() {
        return new RetryListener() {...}
    }
    
    @Bean public RetryListener retryListener2() {
        return new RetryListener() {...}
    }

}

@Service
class Service {
    @Retryable(RemoteAccessException.class)
    public service() {
        // ... do something
    }
}

@Retryable 的属性可以用来控制 RetryPolicy 和 BackoffPolicy ，例如：

@Service
class Service {
    @Retryable(maxAttempts=12, backoff=@Backoff(delay=100, maxDelay=500))
    public service() {
        // ... do something
    }
}

在 100 到 500 毫秒之间进行随机回退，最多尝试12次，还有一个 stateful 属性（默认为 false ）来控制重试是否有状态，要使用有状态重试，拦截方法必须有参数，因为它们用于构造状态的缓存键。

@EnableRetry 注解还查找类型为 Sleeper 的 bean ，以及 RetryTemplate 和拦截器中用于控制运行时重试行为的其他策略。

@EnableRetry 注解为 @Retryable bean 创建代理，代理（应用程序中的 bean 实例）中添加了 Retryable 接口，这纯粹是一个标记接口，但对于希望应用重试建议的其他工具可能很有用（如果 bean 已经实现了 Retryable ，那么它们通常不需要麻烦）。

可以提供恢复方法，以便在重试耗尽时采用另一种代码路径，方法应该与 @Retryable 在同一个类中声明，并标记为 @Recover ，返回类型必须匹配 @Retryable 方法。恢复方法的参数可以有选择地包括抛出的异常，也可以有选择地包括传递给原始 retryable 方法的参数（或者它们的部分列表，只要没有一个被省略），例如：

@Service
class Service {
    @Retryable(RemoteAccessException.class)
    public void service(String str1, String str2) {
        // ... do something
    }
    @Recover
    public void recover(RemoteAccessException e, String str1, String str2) {
       // ... error handling making use of original args if required
    }
}

1.2版引入了对某些属性使用表达式的功能：

@Retryable(exceptionExpression="message.contains('this can be retried')")
public void service1() {
  ...
}

@Retryable(exceptionExpression="message.contains('this can be retried')")
public void service2() {
  ...
}

@Retryable(exceptionExpression="@exceptionChecker.shouldRetry(#root)",
    maxAttemptsExpression = "#{@integerFiveBean}",
  backoff = @Backoff(delayExpression = "#{1}", maxDelayExpression = "#{5}", multiplierExpression = "#{1.1}"))
public void service3() {
  ...
}

从 Spring Retry 1.2.5，对于 exceptionExpression ，不推荐使用模板表达式（ #{...} ），而支持简单表达式字符串（ message.contains('this can be retried') ）。

表达式可以包含属性占位符，比如 #{${max.delay}} 或 #{@exceptionChecker.${retry.method}(#root)}

exceptionExpression 作为 #root 对象对抛出的异常求值。
maxAttemptsExpression 和 @BackOff 表达式属性在初始化期间只计算一次，没有用于计算的根对象，但是它们可以在上下文中引用其他 bean 。

额外依赖项

使用上面显示的 @Retryable 注解应用重试处理的声明式方法对AOP类有额外的运行时依赖性，需要在项目中声明这些类，如果你的应用程序是使用 Spring Boot 实现的，那么最好使用AOP的 Spring Boot starter 解决这个依赖关系，例如，对于Gradle，在 build.gradle 中添加以下行：

runtime('org.springframework.boot:spring-boot-starter-aop')

对于非Boot应用程序，声明运行时依赖于AspectJ的 aspectjweaver 模块的最新版本，例如，对于Gradle，在 build.gradle 中添加以下行：

runtime('org.aspectj:aspectjweaver:1.8.13')

XML配置

下面是一个使用Spring AOP来重复对一个名为 remoteCall 的方法的服务调用的声明式迭代的例子（有关如何配置AOP拦截器的更多细节，请参阅Spring用户指南）：

<aop:config>
    <aop:pointcut id="transactional"
        expression="execution(* com..*Service.remoteCall(..))" />
    <aop:advisor pointcut-ref="transactional"
        advice-ref="retryAdvice" order="-1"/>
</aop:config>

<bean id="retryAdvice"
    class="org.springframework.retry.interceptor.RetryOperationsInterceptor"/>

上面的示例在拦截器中使用默认的 RetryTemplate ，要更改策略或监听器，只需要将 RetryTemplate 实例注入拦截器。

Spring-retry使用指南原荐