建议使用以下浏览器,以获得最佳体验。 IE 9.0+以上版本 Chrome 31+ 谷歌浏览器 Firefox 30+ 火狐浏览器
请选择 进入手机版 | 继续访问电脑版
设置昵称

在此一键设置昵称,即可参与社区互动!

确定
我再想想
选择版块
直达楼层
标签
您还可以添加5个标签
  • 没有搜索到和“关键字”相关的标签
  • 云产品
  • 解决方案
  • 技术领域
  • 通用技术
  • 平台功能
取消

采纳成功

您已采纳当前回复为最佳回复
发表于2021年02月25日 09:41:31 121 1
直达本楼层的链接
楼主
显示全部楼层
[技术干货] 服务器RAID卡CC(一致性检查)功能介绍

服务器RAID卡CC(一致性检查)功能介绍

 

服务器RAID卡CC(一致性检查)功能:

对RAID卡VD的CC特性功能进行的解释,用于更好的理解RAID,并理解CC对性能的影响


关于CC机制以及影响的解释:

介绍:
   RAID卡提供了VD的一致性,测试目的是早期检测奇偶检验和块错误,会读取硬盘上的带有数据的block来识别是否想过的块错误。(即会对所有数据进行一致性检查)

用户指南上的解释:

   针对RAID1/RAID5/RAID6/ RAID10/RAID50/RAID60这类具备冗余功能的RAID级别,Consistency Check(一致性检测)对RAID组中的数据进行一致性检测,RAID0没有Consistency Check。

   对于RAID1/ RAID10这类基于“镜像”的RAID算法,如果主备成员盘之间的Consistency Check结果不一致,则会记录数据不一致的情况,但是不会进行数据的重新写入操作,原因是RAID卡无法判断哪个数据是正确的。对于RAID5/RAID6/RAID50/RAID60,Consistency Check会读取各个成员盘中的数据并做奇偶运算,如果运算结果和校验盘中的数据不一致,则用新生成的数据覆盖校验盘中原数据。

   MegaRAID一致性检查与Patrol Read(巡读)不同之处在于,一致性检查读取条带的所有部分,从条带的数据部分计算奇偶校验,然后将计算的奇偶校验与从驱动器读取的奇偶校验进行比较。当然不适用于RAID0。如果比较失败,则将计算的奇偶校验写入适当的驱动器。此过程可能会影响控制器的性能。 一致性检查可以手动或自动启动,两者都可以通过MegaRAID Storage Manager或storcli设置/启动。在创建奇偶校验类型逻辑驱动器时,在后台模式下自动启动一致性检查,此时每个条带的每个奇偶校验部分都是从条带的现有数据部分创建的,并写入适当的驱动器。默认情况下,MegaRAID一致性检查启用并发模式,每168小时运行一次,性能影响最高达30%,您可以根据您的业务环境检查和设置值。
   

   从CC的处理过程来看,在CC进行一致性检测的时候,如果遇到数据不一致,会通过RAID组的算法,比如奇偶校验,来写入正确的数据,写入的过程会对性能造成一定的影响。(如果正在运行一个包含大量磁盘和块的大型阵列进行检查,而CC可能需要  8-24小时。 这个持续的CC过程,会占用一定比例的资源用于执行检查,会对性能造成一定影响)运行一致性检查时,会有一定比例的容量用于执行检查,默认值为30%(可以更改此值)。CC有两种类型的一致性检查,即并发或顺序。Concurrent是默认设置,可以同时或同时检查每个驱动器。顺序是它按顺序检查每个驱动器的顺序。


image.png


与PR的差别:PR巡检是检测硬盘的medium error,对硬盘本身进行检测,避免上面的bad block影响,导致数据不一致/导致数据丢失等。

   而CC相比PR,是检测VD的数据是否一致,如果遇到数据不一致,会重新写入(奇偶校验,根据VD的算法)来重新写入来修复,但是在进行CC的时候,如果遇到medium error,也会进行修复,这点同PR基本一致。
PR和CC的频率建议:根据PR的机制,是通过检测硬盘的medium error(检测bad block,UCE等错误)后,进行重映射修复,如果有RAID,则进行VD层面的修复。

   理论上频率取决于硬盘和阵列的可靠性和大小。我们可以查找该硬盘的URE(不可恢复的读取错误 - 坏块)速率。该数字越低,需要进行这些检查的频率越高。

   Patrol Read(巡读) =扫描URE的所有磁盘。如果找到,重新映射块,如果可能,从冗余重建。(非常小的性能影响)

   一致性检查=巡检读取,但也重新计算奇偶校验或检查镜像以检查冗余。(显然,性能影响更大)

总结:
   CCRAID卡保证数据完整性的手段,对VDRAID0CC)进行检测,确保数据一致性,并修复块错误,会占用RAID卡资源(并且数据重构的过程会影响RAID资源),所以存在影响性能的情况。
   CC操作给数据完整性性提供了很好的帮助,不建议直接关闭,但是可以结合业务运行,实际影响情况调整周期。





举报
分享

分享文章到朋友圈

分享文章到微博

采纳成功

您已采纳当前回复为最佳回复

Jack20

发帖: 149粉丝: 164

发消息 + 关注

发表于2021年02月25日 10:14:23
直达本楼层的链接
沙发
显示全部楼层

感谢分享

点赞 评论 引用 举报

游客

富文本
Markdown
您需要登录后才可以回帖 登录 | 立即注册

结贴

您对问题的回复是否满意?
满意度
非常满意 满意 一般 不满意
我要反馈
0/200