​分布式数据库技术基础:数据分布介绍

举报
IT技术分享社区 发表于 2023/01/30 21:58:24 2023/01/30
【摘要】 ​ 1、数据分布的定义数据分布是指在分布式环境中通过合理分布数据,提高数据操作自然并行度,以达到最优的执行效率的目的。在构建分布式数据库系统运行环境时,必须考虑数据如何分布在系统的各个场地上。数据分布主要关注的问题是在分布式数据中,如何合理的放置数据,从而使得相关数据之间的相对位置最合适。2、数据分布的内容数据分布的内容主要有数据位置存放问题、高效的数据划分问题两个方面。数据位置存放问题:主...

 

1、数据分布的定义

数据分布是指在分布式环境中通过合理分布数据,提高数据操作自然并行度,以达到最优的执行效率的目的。在构建分布式数据库系统运行环境时,必须考虑数据如何分布在系统的各个场地上。

数据分布主要关注的问题是在分布式数据中,如何合理的放置数据,从而使得相关数据之间的相对位置最合适。


2、数据分布的内容

数据分布的内容主要有数据位置存放问题、高效的数据划分问题两个方面。

数据位置存放问题:主要是研究如何把已经划分好的数据合理放置在网络上,以获得最优的执行效率,从而减少网络传输的数据量。

高效的数据划分问题:如何把数据合理的划分开,使得使用率最高的数据能被放置在性能最好的节点上。


3、数据分布的策略


3.1 集中式

所有的全局数据片都安排一个节点上。

优点:因为数据都存放在一个节点上,对数据的控制管理比较容易、数据的一致性、完整性能够得到保证。

缺点:节点负担太重,容易出现性能瓶颈、节点依赖性太强,如果该节点出现故障,将使整个系统崩溃、可靠性相对较差。对节点设备要求会很高。


3.2 分割式 

所有全局数据有且只有一份,它们被分割出若干个逻辑片段,每个逻辑片段被分别指派在特定的节点上,对全局数据进行了划分。

优点:数据存储量大、存放在各个节点可以自治检索和修改数据、因为数据是分布在多个节点上的,如果部分节点出现故障,系统仍然可以运行、可靠性较好。

缺点:针对全局修改、查询等操作需要时间会比集中式长一些,因为数据在不同节点需要进行网络通信。


3.3 复制式 

全局数据有多个副本,每个站点上都有完整的数据副本。

优点:系统可靠性较高、响应速度快、数据恢复很容易。

缺点:保持各个节点的同步修改操作要付出高昂的代价、数据冗余很大。


3.4 混合式

全局数据被划分为若干个数据子集,每个子集被放在不同的节点上,但任何一个节点上都没有保持全部的数据,根据数据的重要性决定各个数据子集副本的数量。

优点:兼顾了分割式和复制式的优点、灵活性好、可以提高系统的效率。

缺点:包括了分割式和复制式的复杂性。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。