分布式数据库技术基础:数据分片介绍
【摘要】 1、数据分片定义数据分片也成为数据分割,是分布式数据库的特征之一。一般在一个分布式数据库中,全局数据库是由各个局部数据库逻辑组合而成的,反之各个局部数据库是由全局数据库的某种分割逻辑而得的。数据分片得到的各部分元组成为该关系的逻辑片段,并被存放在相应的节点上。这样处理可以各得其所,大大减少网络上的通信,提高系统响应效率。2、数据分片的方法介绍2.1 水平分片根据特定条件把全局关系的所有元组...
1、数据分片定义
数据分片也成为数据分割,是分布式数据库的特征之一。一般在一个分布式数据库中,全局数据库是由各个局部数据库逻辑组合而成的,反之各个局部数据库是由全局数据库的某种分割逻辑而得的。
数据分片得到的各部分元组成为该关系的逻辑片段,并被存放在相应的节点上。这样处理可以各得其所,大大减少网络上的通信,提高系统响应效率。
2、数据分片的方法介绍
2.1 水平分片
根据特定条件把全局关系的所有元组,划分成若干个互补相交的子集。每个子集为全局关系的一个逻辑片段。它们通过对全局关系施加选择运算得到,并且可以通过对这些片段执行合并操作来恢复全局关系。
2.2 垂直分片
把全局关系的属性分成若干个子集,对全局关系做投影运算得到这些子集。要求全局关系的每一个属性至少映射到一个垂直片段中,并且每一个垂直片段都包含该全局关系的关键字。这样通过这些片段执行连接操作可以恢复该全局关系。
2.3 水平和垂直结合的分片
可以先水平再垂直分片,也可以反向为之。
3、数据分片原则
-
完备性条件:必须把全局关系的所有数据映射到各个片段中,绝不允许有属于全局关系却不属于任何一个片段的数据存在。
-
可重构条件:必须保证能够由同一个全局关系的各个片段来重新构造该全局关系。对于水平分片可用并操作重构全局关系;对于垂直分片可以用连接操作重构全局关系。
-
不相交条件:要求一个全局关系被分割后所得的各数据片段互补重叠或只包含关键字重叠。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)