存储基本知识总结

举报
高晓云 发表于 2017/10/11 16:56:55 2017/10/11
【摘要】 数据复制(Replication)是指利用复制软件把数据从一个磁盘复制到另一个磁盘,生成一个数据副本。这个数据副本是数据处理系统直接可以访问的,不需要进行任何的数据恢复操作,这一点是复制与D2D备份的最大区别。

网络存储主要技术

1.DAS:直接附加存储

DAS是指将存储设备通过SCSI线缆或光纤通道直接连接到服务器上。一个SCSI环路或光纤通道中可以挂载16台设备,FC可以在仲裁环的方式下支持126个设备。

优点:结构简单、易于实现

缺点:扩展性差、资源利用率低、可管理性差。

2.SAN:存储区域网络

SAN是一种通过网络方式连接存储设备和应用服务器的存储架构,这个网络专用于主机和存储设备之间的访问。当有数据的存取访问时,数据可以通过存储区域网络在服务器和后台存储设备之间高速传输。

优点:可扩展性强、数据备份和恢复不会影响业务、传输速率快

缺点:成本高、维护困难。

3.NAS:网络附加存储

NAS是一种文件共享服务。拥有自己的文件系统,通过NFS或CIFS对外提供文件访问服务。

优点:易于部署和扩展,在网络可靠的情况下,几乎是即插即用;适用于部门级的低成本的文件服务器;支持多种文件协议,数据共享性好。

缺点:增加网络拥塞,性能也严重受制于网络传输数据能力;由于是文件级共享,不提供裸设备存储,因此不适于关系数据库(其高级特性如并行查询、全表锁定等将不能使用)和OLTP事务。

主要协议和相关技术

SCSI: Small Computer System Interface,于1979首次提出,是为小型机研制的一种接口技术,现在已完全普及到了小型机,高低端服务器以及普通PC上。可以划分为SCSI-1、SCSI-2、SCSI-3(最新,其最高传输速率30MB/s-320MB/s)。

iSCSI:互联网小型计算机系统接口,是一种在TCP/IP上进行数据块传输的标准。

工作流程:

iSCSI系统由SCSI适配器发送一个SCSI命令。

命令封装到TCP/IP包中并送入到以太网络。

接收方从TCP/IP包中抽取SCSI命令并执行相关操作。

把返回的SCSI命令和数据封装到TCP/IP包中,将它们发回到发送方。

系统提取出数据或命令,并把它们传回SCSI子系统。

FC:光纤通道,用于计算机设备之间的传输。传输率达到2G。

RAID技术

1.RAID0:也称为条带化,将数据分成一定的大小顺序的写到阵列的磁盘里,可以并行的执行读写操作,可以充分地利用带宽。

缺点:不提供数据冗余保护,一旦数据损坏,将无法恢复。

2.RAID1:也成为镜像,它将数据完全一致的分别写道工作磁盘和镜像磁盘,磁盘利用率为50%。提供了最佳的数据保护。

3.RAID2:也称为纠错海明码磁盘,阵列中序号为2N的磁盘(第1、2、4、6......)作为校验盘,RAID2的硬盘利用率很低,实施复杂,目前基本不再使用。

4.RAID3:RAID3采用一个硬盘作为校验盘,其余磁盘作为数据盘,数据按位或字节的方式交叉的存取到各个数据盘中。不同磁盘上同一带区的数据做异或校验,并把校验值写入到校验盘中。

5.RAID4:RAID4与RAID3基本一致,区别在于条带化的方式不一样,RAID4按照块的方式存放数据,所以在写操作时只涉及两块磁盘,数据盘和校验盘,提高了系统的IO性能。但面对随机的分散的写操作,单一的校验盘往往成为性能瓶颈。

6.RAID5:RAID5与RAID3的机制相似,但是数据校验的信息被均匀的分散到的阵列的各个磁盘上,这样就不存在并发写操作时的校验盘性能瓶颈。阵列的磁盘上既有数据,也有数据校验信息,数据块和对应的校验信息会存储于不同的磁盘上,当一个数据盘损坏时,系统可以根据同一带区的其他数据块和对应的校验信息来重构损坏的数据。

7.RAID6:提供两级冗余,即阵列中的两个驱动器失败时,阵列仍然能够继续工作。

一般而言,RAID6的实现代价最高,因为RAID6不仅要支持数据的恢复,又要支持校验的恢复,这使RAID6控制器比其他级RAID更复杂和更昂贵。

8.RAID10:是RAID1和RAID0的结合,先做镜像然后做条带化,既提高了系统的读写性能,有提供了数据冗余保护,磁盘利用率为50%  

9.RAID01:也是RAID0和RAID1的结合,但它是对条带化后的数据进行镜像。但与RAID10 不同,一个磁盘的丢失等同于整个镜像条带的丢失,所以一旦镜像盘失败,则存储系统成为一个RAID-0 系统(即只有条带化)。RAID01的实际应用非常少。

主机系统高可用技术

4.1双机热备份方式:

在双机热备份方式中,主服务器运行应用,备份服务器处于空闲状态,但实时监测主服务器的运行状态。一但主服务器出现异常或故障,备份服务器立刻接管主服务器的应用。

适用场合:适用于硬件资源充足,对应用系统有严格高可靠性要求的企业、政府、军队、重要商业网站ISP/ICP或数据库应用等用户。这些用户不仅保证主机系统能够24小时提供不间断的服务,还要求发生故障切换时,应用系统的性能和响应速度不受影响,以确保网络系统、网络服务、共享磁盘空间、共享文件系统、进程以及数据库的高速持续运转。

4.2 双机互备份方式:

它没有主服务器和备份服务器之分,两台主机互为备份。主机各自运行不同应用,同时还相互监测对方状况。当任一台主机宕机时,另一台主机立即接管它的应用,以保证业务的不间断运行。也就是目前通常所说的Active/Active方式,主要通过纯软件方式实现双机容错。通常情况下,支持双机热备的软件都可以支持双机互备份方式。

适用场合:适用于在确保应用不间断运行的前提下,从投资的角度考虑,能充分的利用现有的硬件资源的用户。这些用户的应用要求保证业务不间断运行,但在发生故障切换时,允许一定时间内的应用性能的降低。

4.3集群并发存取方式:

多台主机一起工作,各自运行一个或几个服务。当某个主机发生故障时,运行在其上的服务就被其它主机接管。群集并发存取方式在获得高可用性的同时,也显著提高了系统整体的性能。

适用场合:适用于对计算数据处理要求高的应用,其特点是实时性强、阶段性数据流量大、对应用系统有严格高可靠性要求。这种方式需要更多的硬件投资,为企业带来更大的可靠性和更多的任务能力。

数据备份系统

数据备份系统采用的技术主要有数据备份(Backup)和数据复制(Replication)两种。

5.1数据备份

一般是指利用备份软件把数据从磁盘备份到磁带进行离线保存(最新的备份技术也支持磁盘到磁盘的备份,也就是把磁盘作为备份数据的存放介质,以加快数据的备份和恢复速度)。备份数据的格式是磁带格式,不能被数据处理系统直接访问。在源数据被破坏或丢失时,备份数据必须由备份软件恢复成可用数据,才可让数据处理系统访问。

适用场合:受备份策略、备份数据可恢复性等问题影响,不适合于在高等级的容灾方案(RPO小于24小时)作为构建备份数据系统主要的技术。但由于实施方便,成本低廉,适合于低等级的容灾方案中,也可作为高等级容灾方案的辅助技术。在应用停机的情况下进行数据备份就不存在数据一致性问题,当需要在线备份时,一般由备份软件来保证数据一致性。

5.2数据复制

数据复制(Replication)是指利用复制软件把数据从一个磁盘复制到另一个磁盘,生成一个数据副本。这个数据副本是数据处理系统直接可以访问的,不需要进行任何的数据恢复操作,这一点是复制与D2D备份的最大区别。

数据复制依据复制启动点的不同可分为同步复制、异步复制、基于数据增量的复制等几种。对于同步复制,数据复制是在向主机返回写请求确认信号之前实时进行的;对于异步复制,数据复制是在向主机返回写请求确认信号之后实时进行的;而基于数据增量的复制是一种非实时的复制方式,它依据一定的策略(如设定数据变化量门限值、日历安排等)来启动数据复制。

3者比较:

1)同步复制:应用于最高等级的容灾方案(RPO等于0)中,需要关闭主机Cache来保证数据一致性。对于连接生产中心和灾备中心的链路带宽和QoS要求很高,一般采用光纤直连、波分设备来保证,方案部署成本很高。

2)异步复制:应用于较高级别的容灾方案(RPO接近于0)中,无法有效保证数据一致性(关闭主机中的Cache和快照都不适合)。但对于连接生产中心和灾备中心的链路带宽和QoS要求一般,理论上带宽只要达到“日新增数据量/(24×3600×8)”即可。

3)增量复制:应用于较高级别的容灾方案(RPO小于1小时)中,可以结合快照技术有效保证数据一致性。对于连接生产中心和灾备中心的链路带宽和QoS要求一般,理论上带宽只要达到“数据增量/复制间隔”即可。

作者|章华清

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。