RAID e Confiabilidade de Armazenamento
RAID — arrays redundantes de discos independentes — combina múltiplos dispositivos de armazenamento usando striping, espelhamento e paridade para oferecer maior desempenho, capacidade e tolerância a falhas do que qualquer dispositivo único, sendo a base do armazenamento confiável em centros de dados.
Definition
RAID é uma arquitetura de armazenamento que combina múltiplos discos físicos em uma única unidade lógica usando técnicas como striping de dados, espelhamento e paridade para melhorar o desempenho e tolerar a falha de um ou mais discos sem perda de dados.
Scope
Este tópico aborda a confiabilidade do armazenamento através da redundância: os níveis RAID padrão e suas compensações entre desempenho, capacidade e tolerância a falhas; striping, espelhamento e paridade; métricas de confiabilidade como tempo médio entre falhas e os limites da redundância; e como o RAID complementa, mas não substitui, os backups. Exclui os próprios dispositivos de armazenamento (dispositivos de armazenamento secundário) e a camada do sistema de arquivos (sistemas de arquivos).
Core questions
- Como o striping, o espelhamento e a paridade proporcionam desempenho e tolerância a falhas?
- Como os níveis RAID comuns equilibram capacidade, desempenho e confiabilidade?
- Como a confiabilidade de um array é quantificada e quais são os limites da redundância?
- Por que o RAID não é um substituto para backups?
Key concepts
- striping de dados
- espelhamento (RAID 1)
- paridade (RAID 5/6)
- níveis RAID e compensações
- tolerância a falhas
- tempo médio entre falhas (MTTF)
- reconstrução e modo degradado
- redundância não é backup
Key theories
- Redundância para armazenamento confiável
- A combinação de muitos discos comerciais com informações redundantes (espelhamento ou paridade) produz um array que é mais rápido e muito mais confiável do que um único disco; os níveis RAID formalizam como o striping e a redundância são organizados para equilibrar desempenho, capacidade utilizável e tolerância a falhas.
Mechanisms
O striping distribui os dados por vários discos para paralelizar o acesso e aumentar o throughput. O espelhamento mantém cópias completas em múltiplos discos para que o array sobreviva à perda de um disco. Os esquemas de paridade armazenam redundância calculada que permite a reconstrução dos dados quando um disco falha, usando menos capacidade do que o espelhamento. Os níveis RAID padrão combinam essas técnicas de forma diferente; quando um disco falha, o array opera em modo degradado e reconstrói os dados em um disco de substituição usando os dados sobreviventes e a redundância.
Clinical relevance
RAID é ubíquo em servidores, sistemas de armazenamento e centros de dados, onde falhas de disco são rotineiras em escala e a disponibilidade contínua é exigida. A escolha do nível RAID correto equilibra custo, velocidade e resiliência, mas o RAID protege apenas contra falhas de dispositivo, complementando, em vez de substituir, os backups contra exclusão, corrupção e desastres.
History
O conceito de RAID foi introduzido em um artigo de 1988 por Patterson, Gibson e Katz em Berkeley, que propôs o uso de arrays de discos independentes com redundância para igualar a confiabilidade e o desempenho de discos grandes e caros. A taxonomia dos níveis RAID foi amplamente adotada, tornando-se prática padrão no armazenamento empresarial e em centros de dados.
Debates
- RAID de paridade versus espelhamento em escala
- À medida que as capacidades dos discos aumentaram, os longos tempos de reconstrução do RAID de paridade aumentaram o risco de uma segunda falha durante a reconstrução, provocando debate sobre maior redundância (como paridade dupla) versus espelhamento ou esquemas alternativos de código de correção de erros para grandes arrays.
Key figures
- David A. Patterson
- Garth Gibson
- Randy H. Katz
- John L. Hennessy
Related topics
Seminal works
- patterson1988raid
- hennessy2019
Frequently asked questions
- O RAID substitui a necessidade de backups?
- Não. O RAID protege contra falhas de disco armazenando dados redundantes, mas não protege contra exclusão acidental, corrupção de arquivos, malware, falhas simultâneas de múltiplos discos ou desastres no local. Backups independentes continuam sendo essenciais; o RAID melhora a disponibilidade, não a proteção contra perda de dados em geral.
- Qual é a diferença entre espelhamento e paridade?
- O espelhamento mantém cópias duplicadas completas dos dados em discos separados, proporcionando uma recuperação simples e rápida, mas usando metade da capacidade para redundância. A paridade armazena redundância calculada que pode reconstruir dados perdidos usando menos espaço, mas a reconstrução é mais lenta e computacionalmente mais complexa.