@@ -55,4 +55,174 @@ commit transation;
55
55
用系统里,实现转账事务需要通过远程调用,由于网络问题就会导致分布式事务问题。
56
56
57
57
58
- ** 分布式事务采用本地事务的思维去解决是行不通的**
58
+ ** 分布式事务采用本地事务的思维去解决是行不通的**
59
+
60
+
61
+ ## 分布式事务的应用场景
62
+
63
+ 1、典型的场景就是微服务架构 微服务之间通过远程调用完成事务操作。 比如:订单微服务和库存微服务,下单的 同时订单微服务请求库存微服务减库存。 简言之:** 跨JVM进程产生分布式事务** 。
64
+
65
+ ![ ] ( https://oscimg.oschina.net/oscnet/up-7d2d8c1ca0c89de505e6734c8cb736ed09c.png )
66
+
67
+ 2、单体系统访问多个数据库实例 当单体系统需要访问多个数据库(实例)时就会产生分布式事务。 比如:用户信 息和订单信息分别在两个MySQL实例存储,用户管理系统删除用户信息,需要分别删除用户信息及用户的订单信 息,由于数据分布在不同的数据实例,需要通过不同的数据库链接去操作数据,此时产生分布式事务。 简言之:跨 数据库实例产生分布式事务。
68
+
69
+ ![ ] ( https://oscimg.oschina.net/oscnet/up-0345cf3e0e9101f32b904832c75c4ad4e59.png )
70
+
71
+
72
+ 3、多服务访问同一个数据库实例 比如:订单微服务和库存微服务即使访问同一个数据库也会产生分布式事务,原 因就是跨JVM进程,两个微服务持有了不同的数据库链接进行数据库操作,此时产生分布式事务。
73
+
74
+ ![ ] ( https://oscimg.oschina.net/oscnet/up-252777d31619fe349da6343e6313fdb1cca.png )
75
+
76
+
77
+ # 分布式事务基础理论
78
+
79
+ 通过前面的学习,我们了解到了分布式事务的基础概念。与本地事务不同的是,分布式系统之所以叫分布式,是因 为提供服务的各个节点分布在不同机器上,相互之间通过网络交互。不能因为有一点网络问题就导致整个系统无法 提供服务,网络因素成为了分布式事务的考量标准之一。因此,分布式事务需要更进一步的理论支持,接下来,我 们先来学习一下分布式事务的CAP理论。
80
+
81
+
82
+ 在学习分布式事务控制解决方案之前需要先学习一些基础理论,通过理论知识指导我们确定分布式事务控制的目
83
+ 标,从而帮助我们理解每个解决方案。
84
+
85
+
86
+ ## 2.1 CAP理论
87
+
88
+ ### 2.1.1 理解CAP
89
+
90
+ CAP是 Consistency、Availability、Partition tolerance三个词语的缩写,分别表示一致性、可用性、分区容忍性。
91
+
92
+ 下边我们分别来解释: 为了方便对CAP理论的理解,我们结合电商系统中的一些业务场景来理解CAP。
93
+
94
+ 如下图,是商品信息管理的执行流程:
95
+
96
+ ![ ] ( https://oscimg.oschina.net/oscnet/up-5bba57f2c332b8760fdc4d88a4f1ceb8c0c.png )
97
+
98
+ 整体执行流程如下:
99
+
100
+ 1、商品服务请求主数据库写入商品信息(添加商品、修改商品、删除商品)
101
+ 2、主数据库向商品服务响应写入成功。
102
+ 3、商品服务请求从数据库读取商品信息。
103
+
104
+ ### C - Consistency
105
+
106
+ ** 一致性是指写操作后的读操作可以读取到最新的数据状态,当数据分布在多个节点上,从任意结点读取到的数据都是最新的状态。**
107
+
108
+ 上图中,商品信息的读写要满足一致性就是要实现如下目标:
109
+ 1、商品服务写入主数据库成功,则向从数据库查询新数据也成功。
110
+ 2、商品服务写入主数据库失败,则向从数据库查询新数据也失败。
111
+
112
+ ** 如何实现一致性?**
113
+
114
+ 1、写入主数据库后要将数据同步到从数据库。
115
+ 2、写入主数据库后,在向从数据库同步期间要将从数据库锁定,待同步完成后再释放锁,以免在新数据写入成功 后,向从数据库查询到旧的数据。
116
+
117
+ ** 分布式系统一致性的特点:**
118
+
119
+ 1、由于存在数据同步的过程,写操作的响应会有一定的延迟。
120
+ 2、为了保证数据一致性会对资源暂时锁定,待数据同步完成释放锁定资源。
121
+ 3、如果请求数据同步失败的结点则会返回错误信息,一定不会返回旧数据。
122
+
123
+
124
+ ### A - Availability
125
+
126
+ ** 可用性是指任何事务操作都可以得到响应结果,且不会出现响应超时或响应错误。**
127
+
128
+ 上图中,商品信息读取满足可用性就是要实现如下目标:
129
+
130
+ 1、从数据库接收到数据查询的请求则立即能够响应数据查询结果。
131
+ 2、从数据库不允许出现响应超时或响应错误。
132
+
133
+ ** 如何实现可用性?**
134
+
135
+ 1、写入主数据库后要将数据同步到从数据库。
136
+ 2、由于要保证从数据库的可用性,不可将从数据库中的资源进行锁定。
137
+ 3、即时数据还没有同步过来,从数据库也要返回要查询的数据,哪怕是旧数据,如果连旧数据也没有则可以按照 约定返回一个默认信息,但不能返回错误或响应超时。
138
+
139
+ ** 分布式系统可用性的特点:**
140
+ 1、 所有请求都有响应,且不会出现响应超时或响应错误。
141
+
142
+
143
+ ### P - Partition tolerance
144
+ 通常分布式系统的各各结点部署在不同的子网,这就是网络分区,不可避免的会出现由于网络问题而导致结点之间
145
+ 通信失败,此时仍可对外提供服务,这叫分区容忍性。
146
+
147
+ 上图中,商品信息读写满足分区容忍性就是要实现如下目标:
148
+ 1、主数据库向从数据库同步数据失败不影响读写操作。
149
+ 2、其一个结点挂掉不影响另一个结点对外提供服务。
150
+
151
+ ** 如何实现分区容忍性?**
152
+
153
+ 1、尽量使用异步取代同步操作,例如使用异步方式将数据从主数据库同步到从数据,这样结点之间能有效的实现 松耦合。
154
+ 2、添加从数据库结点,其中一个从结点挂掉其它从结点提供服务。
155
+
156
+ ** 分布式分区容忍性的特点:**
157
+
158
+ 1、分区容忍性分是布式系统具备的基本能力。
159
+
160
+
161
+
162
+ ### CAP的组合方式
163
+
164
+
165
+ 1、上边商品管理的例子是否同时具备 CAP呢?
166
+
167
+ 在所有分布式事务场景中不会同时具备CAP三个特性,因为在具备了P的前提下C和A是不能共存的。
168
+
169
+ 比如,下图满足了P即表示实现分区容忍:
170
+
171
+ ![ ] ( https://oscimg.oschina.net/oscnet/up-8f779aeb0e4245b7f15043968224c29d33c.png )
172
+
173
+ 本图分区容忍的含义是:
174
+ 1)主数据库通过网络向从数据同步数据,可以认为主从数据库部署在不同的分区,通过网络进行交互。
175
+ 2)当主数据库和从数据库之间的网络出现问题不影响主数据库和从数据库对外提供服务。
176
+ 3)其一个结点挂掉不影响另一个结点对外提供服务。
177
+
178
+ 如果要实现C则必须保证数据一致性,在数据同步的时候为防止向从数据库查询不一致的数据则需要将从数据库数 据锁定,待同步完成后解锁,如果同步失败从数据库要返回错误信息或超时信息。
179
+
180
+ 如果要实现A则必须保证数据可用性,不管任何时候都可以向从数据查询数据,则不会响应超时或返回错误信息。 通过分析发现在满足P的前提下C和A存在矛盾性。
181
+
182
+
183
+
184
+ #### CAP有哪些组合方式呢?
185
+ 所以在生产中对分布式事务处理时要根据需求来确定满足CAP的哪两个方面。
186
+
187
+ ##### 1)AP:
188
+ 放弃一致性,追求分区容忍性和可用性。这是很多分布式系统设计时的选择。
189
+
190
+ 例如:
191
+ 上边的商品管理,完全可以实现AP,前提是只要用户可以接受所查询的到数据在一定时间内不是最新的即可。
192
+
193
+ 通常实现** AP都会保证最终一致性** ,后面讲的BASE理论就是根据AP来扩展的,一些业务场景 比如:订单退款,今日退款成功,明日账户到账,只要用户可以接受在一定时间内到账即可。
194
+
195
+ ##### 2)CP:
196
+
197
+ 放弃可用性,追求一致性和分区容错性,我们的zookeeper其实就是追求的强一致,又比如跨行转账,一次转账请求要等待双方银行系统都完成整个事务才算完成。
198
+
199
+ ##### 3)CA:
200
+
201
+ 放弃分区容忍性,即不进行分区,不考虑由于网络不通或结点挂掉的问题,则可以实现一致性和可用性。那么系统
202
+ 将不是一个标准的分布式系统,我们最常用的关系型数据就满足了CA。
203
+
204
+ 上边的商品管理,如果要实现CA则架构如下:
205
+
206
+ ![ ] ( https://oscimg.oschina.net/oscnet/up-4bb29694936227b70375e193785ec9ca811.png )
207
+
208
+ 主数据库和从数据库中间不再进行数据同步,数据库可以响应每次的查询请求,通过事务隔离级别实现每个查询请
209
+ 求都可以返回最新的数据。
210
+
211
+ 通过上面我们已经学习了CAP理论的相关知识,CAP是一个已经被证实的理论:
212
+
213
+ 一个分布式系统最多只能同时满足 一致性(Consistency)、可用性(Availability)和分区容忍性(Partition tolerance)这** 三项中的两项** 。它可以作为我们进行架构设计、技术选型的考量标准。对于多数大型互联网应用的场景,结点众多、部署分散,而且现在的集群规模越来越大,所以节点故障、网络故障是常态,而且要保证服务可用性达到N个9(99.99..%),并要达到良好的响应性能来提高用户体验,因此一般都会做出如下选择:** 保证P和A,舍弃C强一致,保证最终一致性。**
214
+
215
+
216
+ ### 2.2 BASE理论
217
+
218
+ #### 1、理解强一致性和最终一致性
219
+
220
+ CAP理论告诉我们一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容忍 性(Partition tolerance)这三项中的两项,其中AP在实际应用中较多,AP即舍弃一致性,保证可用性和分区容忍 性,但是在实际生产中很多场景都要实现一致性,比如前边我们举的例子主数据库向从数据库同步数据,即使不要一致性,但是最终也要将数据同步成功来保证数据一致,这种一致性和CAP中的一致性不同,CAP中的一致性要求 在任何时间查询每个结点数据都必须一致,它** 强调的是强一致性** ,但是最终一致性是允许可以在一段时间内每个结点的数据不一致,但是经过一段时间每个结点的数据必须一致,它强调的是** 最终数据的一致性** 。
221
+
222
+ #### 2、Base理论介绍
223
+
224
+ BASE 是 Basically Available(基本可用)、Soft state(软状态)和 Eventually consistent (最终一致性)三个短语的缩写。BASE理论是对CAP中AP的一个扩展,通过牺牲强一致性来获得可用性,** 当出现故障允许部分不可用但要保证核心功能可用** ,** 允许数据在一段时间内是不一致的,但最终达到一致状态** 。满足BASE理论的事务,我们称之为“柔 性事务”。
225
+
226
+ - ** 基本可用** :分布式系统在出现故障时,允许损失部分可用功能,保证核心功能可用。如,电商网站交易付款出现问题了,商品依然可以正常浏览。
227
+ - ** 软状态** :由于不要求强一致性,所以BASE允许系统中存在中间状态(也叫软状态),这个状态不影响系统可用性,如订单的"支付中"、“数据同步中”等状态,待数据最终一致后状态改为“成功”状态。
228
+ - ** 最终一致** :最终一致是指经过一段时间后,所有节点数据都将会达到一致。如订单的"支付中"状态,最终会变 为“支付成功”或者"支付失败",使订单状态与实际交易结果达成一致,但需要一定时间的延迟、等待。
0 commit comments