副本和EC
副本和EC
存储系统支持多副本和Erasure Coding数据冗余保护方式,即在多副本和EC故障冗余范围内,当物理设备出现故障时,数据仍可被正常访问,并自动恢复故障设备上的数据。
用户可根据需求灵活选择数据冗余保护方式,实现数据可靠性和存储空间利用率的最佳配比。传统的硬盘级RAID模式将数据存放于单节点内的不同硬盘,当整节点发生故障时,无法有效恢复数据。存储系统将数据在节点间进行冗余保护或副本构建,有效避免数据丢失。
相同容错能力下,Erasure Coding比多副本模式的空间利用率高,多副本比Erasure Coding的系统性能好,用户可根据实际情况选择存储池的数据冗余方式。
多副本
存储系统支持二副本和三副本,实现过程以三副本为例,如图1-2所示。
- 当写入数据时,每个数据构建与之完全相同的两个副本; 
- 数据和两个副本分别写入三个存储节点中。 - 表1-2 多副本定义 - 模式 - 模式描述 - 硬盘利用率范围 - 模式所需最少节点数 - 两副本 - 每个数据构建1个副本,在服务器安全下,允许任意1个存储节点,或在机柜级安全下,任意1台机柜故障而不影响数据完整性。 - 50% - 3 - 三副本 - 每个数据构建2个副本,在服务器安全下,允许任意2个存储节点,或在机柜级安全下,任意2台机柜故障而不影响数据完整性。 - 33% - 3 
- 两副本模式时,节点故障后,延迟60分钟启动重构。 
- 三副本模式时,节点故障后,延迟7天启动重构。 
Erasure Coding
存储系统Erasure Coding的保护级别以N+M模式表达,其中,N表示数据分片个数,M表示校验分片个数。存储系统支持N+2、N+3、N+4保护级别,保护级别及模式详情见表1-3。
实现过程以N+2级别(N取值为4)为例进行说明:
图1-3 Erasure Coding的基本原理(4+2级别)
- 将所存入的数据切分为4个数据分片; 
- 以4个数据分片为一组,通过计算生成2个校验分片; 
- 再将数据分片和校验分片以冗余配比的形式写入到6个存储节点中。 
图1-4 Erasure Coding的基本原理(4+2:1级别)
- 将所存入的数据切分为4个数据分片; 
- 以4个数据分片为一组,通过计算生成2个校验分片; 
- 再将数据分片和校验分片以冗余配比的形式写入到3个存储节点中。 
| 模式 | 模式描述 | 硬盘利用率范围 | 模式所需最少节点数/机柜数 | 
|---|---|---|---|
| N+2 | 每个数据包括N个数据分片和2个通过计算生成的校验数据。 
 
 N的范围为:4、6、8、10、12、14、16、18、20、22 | 66.66%~91.67% | 
 | 
| N+3 | 每个数据包括N个数据分片和3个通过计算生成的校验数据。 
 
 | 66.66%~86.9% | 
 | 
| N+4 | 每个数据包括N个数据分片和4个通过计算生成的校验数据。 
 
 | 60%~83.33% | 
 | 
| 注1:保护级别以N+M模式表达。其中,N表示数据分片个数;M表示校验分片个数。 注2:同一模式下,N越大,磁盘利用率越高。 | |||
- N+M模式且节点个数大于等于N+M时,节点故障后,延迟7天启动重构。 
- N+M模式且节点个数小于N+M时,节点故障后,延迟60分钟启动重构。 
- 点赞
- 收藏
- 关注作者
 
            
 
           
评论(0)