一致性保证
数据库复制中发生的一些时序问题。同一时刻查看两个数据库节点,则可能在两个节点上看到不同的数据,因为写请求在不同的时间到达不同的节点。无论数据库使用何种复制方法(单主复制,多主复制或无主复制),都会出现这些不一致。
大多数复制的数据库至少提供最终一致性,即若停止向DB写并等待一段不确定时间,则最终所有读取请求都会返回相同值。即不一致现象只是暂时,最终会达到一致。最终一致性意味着收敛(convergence),即预期所有副本最终会收敛到相同值。
但这是个很弱保证,不知何时系统收敛。收敛前,读可能会返回任何值甚至读失败。如若你写入了一个值,然后立即再次读取,这并不能保证你能看到刚才写入的值,因为读请求可能会被路由到其它副本。
对于SE,最终一致性很难,和普通的单线程程序中变量读写行为很不同,若将一个值赋给某变量,再很快读取,不可能读到旧的值或读取失败。而DB表面上看起来像个可读写的变量,其实有更复杂的语义。
和只提供弱保证DB打交道时,需始终意识其局限性。当系统故障(如网络中断)或高并发时,最终一致性的边缘情况才会凸显。
因此,本文探索数据系统更强的一致性模型,可能会比保证较差系统具有更差性能或更低容错性。但更强的保证能吸引人,因为它们不容易出错。熟悉不同的一致性模型,才能更好地决定最适合的。
分布式一致性模型和之前讨论的事务隔离级别的层次结构有相似。尽管两者有一部分内容重叠,但它们大多是无关问题:事务隔离主要是为避免由于同时执行事务而导致的竞争状态,而分布式一致性主要关于在面对延迟和故障时如何协调副本间的状态。
本文涵盖广泛话题,但这些领域实际上紧密联系:
-
最强的一致性模型:线性一致性(linearizability)
-
然后检查分布式系统中事件顺序问题,特别是因果关系和全局顺序
-
- 点赞
- 收藏
- 关注作者
评论(0)