Spring Cloud 中的分布式事务,附源码《一》

回复“ 1024 ”或 “ 面试题 ” 获取 4T架构师 资料

投稿作者:小东啊 微信公众号:李浩东的博客 | ID:lihaodong_blog

一. 需求

开发我的开源项目 prex 时,加入工作流,解决工作流用户与当前系统用户同步问题时,涉及到远程调用操作两个数据库所产生的事务问题,比如系统用户在增加用户同步工作流用户时,系统用户添加成功,工作流用户没有添加成功,则造成数据不一致问题,本地事务无法回滚,那么则使用分布式事务解决方案。

开源项目:

https://gitee.com/kaiyuantuandui/prex

二. 什么是分布式事务?

指一次大的操作由不同的小操作组成的,这些小的操作分布在不同的服务器上,分布式事务需要保证这些小操作要么全部成功,要么全部失败。从本质上来说,分布式事务就是为了保证不同数据库的数据一致性

通俗一点说就是单体应用被拆分成微服务应用,原来的一个模块被拆分成三个独立的应用,分别使用独立的数据源,业务操作需要调用三个服务来完成。

三. 分布式事务解决方案

分布式事务作为微服务应用中的大难题,在现有的解决方案中,个人认为 Seata 是目前最轻量的解决方案

四. Seata 是什么?

Seata 是一款开源的分布式事务解决方案,致力于提供高性能和简单易用的分布式事务服务。 Seata 将为用户提供了 AT、TCC、SAGA 和 XA 事务模式,为用户打造一站式的分布式解决方案。

AT 模式

前提

1、基于支持本地 ACID 事务的关系型数据库。

2、Java 应用,通过 JDBC 访问数据库。

整体机制

两阶段提交协议的演变:

一阶段:

业务数据和回滚日志记录在同一个本地事务中提交,释放本地和连接资源。

二阶段:

1、提交异步化,非常快速地完成。 2、 回滚通过一阶段的回滚日志进行反向补偿。

写隔离

1、一阶段本地事务提交前,需要确保先拿到全局锁 。

2、拿不到 全局锁 ,不能提交本地事务。

3、拿 全局锁 的尝试被限制在一定范围内,超出范围将放弃,并回滚本地事务,释放本地锁。

以一个示例来说明:

两个全局事务 tx1 和 tx2,分别对 a 表的 m 字段进行更新操作,m 的初始值 1000。

tx1 先开始,开启本地事务,拿到本地锁,更新操作 m = 1000 – 100 = 900。本地事务提交前,先拿到该记录的 全局锁 ,本地提交释放本地锁。 tx2 后开始,开启本地事务,拿到本地锁,更新操作 m = 900 – 100 = 800。本地事务提交前,尝试拿该记录的 全局锁 ,tx1 全局提交前,该记录的全局锁被 tx1 持有,tx2 需要重试等待 全局锁 。

Spring Cloud 中的分布式事务,附源码《一》

tx1 二阶段全局提交,释放 全局锁 。tx2 拿到 全局锁 提交本地事务。

Spring Cloud 中的分布式事务,附源码《一》

如果 tx1 的二阶段全局回滚,则 tx1 需要重新获取该数据的本地锁,进行反向补偿的更新操作,实现分支的回滚。

此时,如果 tx2 仍在等待该数据的 全局锁,同时持有本地锁,则 tx1 的分支回滚会失败。分支的回滚会一直重试,直到 tx2 的 全局锁 等锁超时,放弃 全局锁 并回滚本地事务释放本地锁,tx1 的分支回滚最终成功。

因为整个过程 全局锁 在 tx1 结束前一直是被 tx1 持有的,所以不会发生 脏写 的问题。

读隔离

在数据库本地事务隔离级别 读已提交(Read Committed) 或以上的基础上,Seata(AT 模式)的默认全局隔离级别是 读未提交(Read Uncommitted) 。

如果应用在特定场景下,必需要求全局的 读已提交 ,目前 Seata 的方式是通过 SELECT FOR UPDATE 语句的代理。

Spring Cloud 中的分布式事务,附源码《一》

SELECT FOR UPDATE 语句的执行会申请 全局锁 ,如果 全局锁 被其他事务持有,则释放本地锁(回滚 SELECT FOR UPDATE 语句的本地执行)并重试。这个过程中,查询是被 block 住的,直到 全局锁 拿到,即读取的相关数据是 已提交 的,才返回。

出于总体性能上的考虑,Seata 目前的方案并没有对所有 SELECT 语句都进行代理,仅针对 FOR UPDATE 的 SELECT 语句。

工作机制

以一个示例来说明整个 AT 分支的工作过程。

业务表:product

Field Type Key
id bigint(20) PRI
name varchar(100)
since varchar(100)

AT 分支事务的业务逻辑:

update product set name = ‘GTS’ where name = ‘TXC';

一阶段

过程:

1、解析 SQL:得到 SQL 的类型(UPDATE),表(product),条件(where name = ‘TXC’)等相关的信息。

2、查询前镜像:根据解析得到的条件信息,生成查询语句,定位数据。

得到前镜像:

id name since 1 TXC 2014

3、执行业务 SQL:更新这条记录的 name 为 ‘GTS’。

4、查询后镜像:根据前镜像的结果,通过 主键 定位数据。

得到后镜像:

id name since 1 GTS 2014

5、插入回滚日志:把前后镜像数据以及业务 SQL 相关的信息组成一条回滚日志记录,插入到 UNDO_LOG 表中。

6、提交前,向 TC 注册分支:申请 product 表中,主键值等于 1 的记录的 全局锁 。

7、本地事务提交:业务数据的更新和前面步骤中生成的 UNDO LOG 一并提交。

8、将本地事务提交的结果上报给 TC。

二阶段-回滚

1、收到 TC 的分支回滚请求,开启一个本地事务,执行如下操作。

2、通过 XID 和 Branch ID 查找到相应的 UNDO LOG 记录。

3、数据校验:拿 UNDO LOG 中的后镜与当前数据进行比较,如果有不同,说明数据被当前全局事务之外的动作做了修改。这种情况,需要根据配置策略来做处理,详细的说明在另外的文档中介绍。

根据 UNDO LOG 中的前镜像和业务 SQL 的相关信息生成并执行回滚的语句:

4、提交本地事务。并把本地事务的执行结果(即分支事务回滚的结果)上报给 TC。

二阶段-提交

1、收到 TC 的分支提交请求,把请求放入一个异步任务的队列中,马上返回提交成功的结果给 TC。

2、异步任务阶段的分支提交请求将异步和批量地删除相应 UNDO LOG 记录。

附录

回滚日志表

UNDO_LOG Table:不同数据库在类型上会略有差别。

以 MySQL 为例:

Field Type
branch_id bigint PK
xid varchar(100)
context varchar(128)
rollback_info longblob
log_status tinyint
log_created datetime
log_modified datetime

TCC 模式

回顾总览中的描述:一个分布式的全局事务,整体是 两阶段提交 的模型。全局事务是由若干分支事务组成的,分支事务要满足 两阶段提交 的模型要求,即需要每个分支事务都具备自己的:

一阶段 prepare 行为

二阶段 commit 或 rollback 行为

Spring Cloud 中的分布式事务,附源码《一》

根据两阶段行为模式的不同,我们将分支事务划分为 Automatic (Branch) Transaction Mode 和 Manual (Branch) Transaction Mode.

AT 模式(参考链接 TBD)基于 支持本地 ACID 事务 的 关系型数据库:

一阶段prepare 行为:在本地事务中,一并提交业务数据更新和相应回滚日志记录。

二阶段commit 行为:马上成功结束,自动 异步批量清理回滚日志。

二阶段rollback 行为:通过回滚日志,自动 生成补偿操作,完成数据回滚。

相应的,TCC 模式,不依赖于底层数据资源的事务支持:

一阶段prepare 行为:调用 自定义 的 prepare 逻辑。

二阶段commit 行为:调用 自定义 的 commit 逻辑。

二阶段rollback 行为:调用 自定义 的 rollback 逻辑。

所谓 TCC 模式,是指支持把 自定义 的分支事务纳入到全局事务的管理

Saga 模式

Saga 模式是 SEATA 提供的长事务解决方案,在 Saga 模式中,业务流程中每个参与者都提交本地事务,当出现某一个参与者失败则补偿前面已经成功的参与者,一阶段正向服务和二阶段补偿服务都由业务开发实现。

Spring Cloud 中的分布式事务,附源码《一》

理论基础:Hector & Kenneth 发表论⽂ Sagas (1987)

适用场景:

1、业务流程长、业务流程多

2、参与者包含其它公司或遗留系统服务,无法提供 – TCC 模式要求的三个接口

优势:

1、一阶段提交本地事务,无锁,高性能

2、事件驱动架构,参与者可异步执行,高吞吐

3、补偿服务易于实现

缺点:

不保证隔离性(应对方案见用户文档)

五. 准备工作

1、这里我们使用 Nacos 作为注册中心,Nacos 的安装及使用可以参考

2、我们从官网下载 seata-server ,这里下载的是 seata-server-0.9.0.zip,下载地址:https://github.com/seata/seata/releases

github 地址下载速度很慢,可以在公众号后台回复 seata安装包 快速获取百度下载链接

3、下载完成后解压 seata-server 安装包到指定目录

解压完成后我们得到了几个文件夹

Spring Cloud 中的分布式事务,附源码《一》

1、bin

存放各个系统的 seata server 启动脚本

3、conf

存在 seata server 启动时所需要的配置信息、数据库模式下所需要的建表语句

3、lib

运行 seata server 所需要的依赖包列表

配置 Seata Server

seata server 所有的配置都在 conf 文件夹内,该文件夹内有两个文件我们必须要详细介绍下。

seata server 默认使用 file(文件方式)进行存储事务日志、事务运行信息,我们可以通过-m db 脚本参数的形式来指定,目前仅支持 file、db 这两种方式。

1、file.conf

该文件用于配置存储方式、透传事务信息的 NIO 等信息,默认对应 registry.conf 文件内的 file 方式配置

2、registry.conf

seata server 核心配置文件,可以通过该文件配置服务注册方式、配置读取方式。

注册方式目前支持 file 、nacos 、eureka、redis、zk、consul、etcd3、sofa 等方式,默认为 file,对应读取 file.conf 内的注册方式信息。

读取配置信息的方式支持 file、nacos 、apollo、zk、consul、etcd3 等方式,默认为 file,对应读取 file.conf 文件内的配置。

修改 conf 目录下的 file.conf 配置文件,主要修改自定义事务组名称,事务日志存储模式及数据库连接信息

说明:

1、存储事务日志可以使用 file 文件和 db 数据库两种方式

2、由于我们使用了 db 模式存储事务日志,所以我们需要创建一个 seat 数据库,建表 sql 在 seata-server 的/conf/db_store.sql 中

Spring Cloud 中的分布式事务,附源码《一》

3、修改 conf 目录下的 registry.conf 配置文件,指明注册中心为 nacos,及修改 nacos 连接信息即可;

配置完成后启动 Seata

启动 seata server 的脚本位于 bin 文件内, Linux/Mac 环境使用 seata-server.sh 脚本启动,Windows 环境使用 seata-server.bat 脚本启动。

Linux/Mac 启动方式示例如下所示:

通过 nohup 命令让 seata server 在系统后台运行。

脚本参数:

1、-p

指定启动 seata server 的端口号。

2、-h

指定 seata server 所绑定的主机,这里配置要注意指定的主机 IP 要与业务服务内的配置文件保持一致,如:-h 192.168.1.10,业务服务配置文件内应该配置 192.168.1.10,即使在同一台主机上也要保持一致。

3、-m

事务日志、事务执行信息存储的方式,目前支持 file(文件方式)、db(数据库方式,建表语句请查看 config/dbstore.sql、config/dbundo_log.sql)

查看启动日志

Spring Cloud 中的分布式事务,附源码《一》

当我们看到-Server started 时并未发现其他错误信息,我们的 seata server 已经启动成功

六. 实战演示

让我们从一个微服务示例开始

用户购买商品的业务逻辑。整个业务逻辑由 3 个微服务提供支持:

1、仓储服务:对给定的商品扣除仓储数量。

2、订单服务:根据采购需求创建订单。

3、帐户服务:从用户帐户中扣除余额。

架构图

Spring Cloud 中的分布式事务,附源码《一》

数据库

创建业务数据库

db-order:存储订单的数据库

db-storage:存储库存的数据库

db-account:存储账户信息的数据库

order 订单表:

product 商品表:

account 账户表:

创建日志回滚表

需要在每个数据库中创建日志回滚表,建表 sql 在 seata-server 的/conf/dbundolog.sql 中。

分布式事务问题产生

三个服务,一个订单服务,一个仓储服务,一个账户服务。当用户下单时,会在订单服务中创建一个订单,然后通过远程调用库存服务来扣减下单商品的库存,再通过远程调用账户服务来扣减用户账户里面的余额,最后在订单服务中修改订单状态为已完成。该操作跨越三个数据库,有两次远程调用,很明显会有分布式事务问题

工程结构

Spring Cloud 中的分布式事务,附源码《一》

nacos-seata-account-server 账户服务

nacos-seata-order-server 订单服务

nacos-seata-storage-server 仓储服务

客户端配置

对 nacos-seata-account-server、nacos-seata-order-server 和 nacos-seata-storage-server 三个 seata 的客户端进行配置,它们配置大致相同,我们下面以 nacos-seata-account-server 的配置为例;

1、修改 application.yml 文件,自定义事务组的名称

2、添加并修改 file.conf 配置文件,主要是修改自定义事务组名称

添加并修改 registry.conf 配置文件,主要是将注册中心改为 nacos

代码只展示核心代码 具体代码文章尾部链接

3、在启动类中取消数据源的自动创建

4、配置 MybatisPlus 使用 Seata 对数据源进行代理

MyBatisPlusConfig:

5、使用@GlobalTransactional 注解开启分布式事务

七. 启动服务功能演示

1、分别运行 nacos-seata-order-server、nacos-seata-storage-server 和 nacos-seata-account-server 三个服务

Spring Cloud 中的分布式事务,附源码《一》

可以看到 seata 注册成功

2、查询数据库初始数据信息

Spring Cloud 中的分布式事务,附源码《一》 Spring Cloud 中的分布式事务,附源码《一》 Spring Cloud 中的分布式事务,附源码《一》

3、打开浏览器/Postman 调用接口进行下单操作:

http://localhost:8081/order/create?userId=1&productId=1&count=1&payMoney=50

结果:

Spring Cloud 中的分布式事务,附源码《一》

查看控制台打印: 订单服务:

Spring Cloud 中的分布式事务,附源码《一》

仓储服务:

Spring Cloud 中的分布式事务,附源码《一》

账户服务:

Spring Cloud 中的分布式事务,附源码《一》

4、再次数据库查询

Spring Cloud 中的分布式事务,附源码《一》 Spring Cloud 中的分布式事务,附源码《一》 Spring Cloud 中的分布式事务,附源码《一》

5、我们在 nacos-seata-account-server 中制造一个超时异常后(其他异常也行),调用下单接口

修改完会重启账户服务,再次发送请求

Spring Cloud 中的分布式事务,附源码《一》

订单服务控制台:

Spring Cloud 中的分布式事务,附源码《一》

可以看到订单正常,扣除库存正常,账户服务读取超时异常

6、发现下单后数据库数据并没有任何改变

Spring Cloud 中的分布式事务,附源码《一》

7、我们在 seata-order-service 中注释掉@GlobalTransactional 来看看会发生什么

保存重启订单服务,再次请求接口

由于 nacos-seata-account-server 的超时会导致当库存和账户金额扣减后订单状态并没有设置为已经完成

Spring Cloud 中的分布式事务,附源码《一》

八. Seata 事务分组

下一篇更新

Seata 分布式事务原理解释

下一篇更新

项目源码地址

https://gitee.com/li_haodong/SpringCloudAlibabaLearn

参考资料: http://seata.io/zh-cn

近期技术热文

1、
阿里不让多表 join?我偏要!不服,你咬我啊!

2、


IDEA的这几个调试的骚操作,用了都说爽!

3、


全球43亿个IPv4地址,今日正式耗尽,将向IPv6过度

4、


是时候扔掉 Postman 了,试试 IDEA 自带的高能神器

5、


手写一个简版的Redis,实现高性能的key/value服务

6、


Spring Cloud 分布式服务限流实战,为你排好了

Spring Cloud 中的分布式事务,附源码《一》

原文 

http://mp.weixin.qq.com/s?__biz=MzA3MTUzOTcxOQ==&mid=2452968722&idx=1&sn=5409dcf1ae4c485ecd5292ed17f6dbaf

本站部分文章源于互联网,本着传播知识、有益学习和研究的目的进行的转载,为网友免费提供。如有著作权人或出版方提出异议,本站将立即删除。如果您对文章转载有任何疑问请告之我们,以便我们及时纠正。

PS:推荐一个微信公众号: askHarries 或者qq群:474807195,里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化这些成为架构师必备的知识体系。还能领取免费的学习资源,目前受益良多

转载请注明原文出处:Harries Blog™ » Spring Cloud 中的分布式事务,附源码《一》

赞 (0)
分享到:更多 ()

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址