RAID与存储可靠性
RAID(廉价磁盘冗余阵列)通过条带化、镜像和奇偶校验结合多个存储设备,以提供比任何单个设备更高的性能、容量和容错能力,是数据中心可靠存储的基础。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
RAID是一种存储架构,它通过数据条带化、镜像和奇偶校验等技术将多个物理驱动器组合成一个逻辑单元,以提高性能并容忍一个或多个驱动器故障而不丢失数据。
Scope
本主题涵盖通过冗余实现存储可靠性:标准RAID级别及其在性能、容量和容错能力之间的权衡;条带化、镜像和奇偶校验;可靠性指标,如平均故障间隔时间以及冗余的局限性;以及RAID如何补充而非取代备份。它不包括存储设备本身(辅助存储设备)和文件系统层(文件系统)。
Core questions
- 条带化、镜像和奇偶校验如何提供性能和容错能力?
- 常见的RAID级别如何在容量、性能和可靠性之间进行权衡?
- 阵列可靠性如何量化,冗余的局限性是什么?
- 为什么RAID不能替代备份?
Key concepts
- 数据条带化
- 镜像(RAID 1)
- 奇偶校验(RAID 5/6)
- RAID级别和权衡
- 容错能力
- 平均故障间隔时间 (MTTF)
- 重建和降级模式
- 冗余不是备份
Key theories
- 冗余实现可靠存储
- 将多个商用磁盘与冗余信息(镜像或奇偶校验)结合,可以形成一个比单个磁盘更快、更可靠的阵列;RAID级别将条带化和冗余的排列方式标准化,以平衡性能、可用容量和容错能力。
Mechanisms
条带化将数据分散到多个驱动器上,以实现并行访问并提高吞吐量。镜像在多个驱动器上保留完整副本,以便阵列在驱动器丢失时仍能正常运行。奇偶校验方案存储计算出的冗余数据,当驱动器发生故障时,可以使用这些数据重建数据,且比镜像占用更少的容量。标准RAID级别以不同方式组合这些技术;当驱动器发生故障时,阵列会降级运行,并使用幸存数据和冗余数据在替换驱动器上进行重建。
Clinical relevance
RAID在服务器、存储系统和数据中心中无处不在,在这些地方,大规模驱动器故障是常态,并且需要持续可用性。选择正确的RAID级别可以平衡成本、速度和弹性,但RAID仅能防止设备故障,因此它补充而非取代了针对删除、损坏和灾难的备份。
History
RAID概念由Patterson、Gibson和Katz于1988年在伯克利发表的一篇论文中提出,该论文建议使用廉价磁盘阵列和冗余来匹配昂贵大型驱动器的可靠性和性能。RAID级别的分类被广泛采用,成为企业和数据中心存储的标准实践。
Debates
- 大规模奇偶校验RAID与镜像的争议
- 随着驱动器容量的增长,奇偶校验RAID漫长的重建时间增加了在重建过程中发生第二次故障的风险,从而引发了关于更高冗余(如双奇偶校验)与镜像或替代纠删码方案在大规模阵列中应用的争论。
Key figures
- David A. Patterson
- Garth Gibson
- Randy H. Katz
- John L. Hennessy
Related topics
Seminal works
- patterson1988raid
- hennessy2019
Frequently asked questions
- RAID是否取代了备份的需要?
- 不。RAID通过存储冗余数据来防止驱动器故障,但它不能防止意外删除、文件损坏、恶意软件、同时发生的多驱动器故障或站点灾难。独立的备份仍然至关重要;RAID提高了可用性,但不能全面保护数据免受损失。
- 镜像和奇偶校验有什么区别?
- 镜像在不同的驱动器上保留完整的数据副本,提供简单、快速的恢复,但冗余会占用一半的容量。奇偶校验存储计算出的冗余数据,可以用更少的空间重建丢失的数据,但重建速度较慢且计算量更大。