Sistemas de Armazenamento e E/S
Os sistemas de armazenamento e E/S conectam o processador e a memória ao mundo exterior e a dados persistentes, abrangendo barramentos e interconexões, armazenamento em disco e flash, redundância para confiabilidade e os mecanismos que movem dados eficientemente entre dispositivos e memória.
Definition
Sistemas de armazenamento e E/S são os mecanismos de hardware e arquitetônicos pelos quais um computador transfere dados de e para dispositivos periféricos e os armazena persistentemente, incluindo as interconexões, controladores, mídias de armazenamento e as técnicas de confiabilidade e virtualização envolvidas.
Scope
Esta área abrange como os computadores se comunicam com periféricos e armazenam dados de forma durável: arquitetura e barramentos de E/S, transferência orientada por interrupção e DMA, dispositivos de armazenamento secundário (discos magnéticos e unidades de estado sólido), confiabilidade de armazenamento através de redundância como RAID e virtualização de E/S. Trata dos mecanismos de hardware e arquitetônicos de entrada/saída e persistência. Exclui a abstração de software de sistema de arquivos (sistemas operacionais) e caches on-chip e memória principal (hierarquia de memória e caches), embora trabalhe em estreita colaboração com ambos.
Sub-topics
Core questions
- Como os dispositivos são conectados ao processador e à memória através de barramentos e interconexões?
- Como os dados são transferidos eficientemente usando interrupções e acesso direto à memória em vez de sondagem ocupada (busy polling)?
- Quais são as características de desempenho e confiabilidade do armazenamento magnético e de estado sólido?
- Como a redundância, como o RAID, troca capacidade por confiabilidade e desempenho?
- Como a E/S é virtualizada e compartilhada com segurança entre máquinas virtuais e processos?
Key concepts
- Barramentos e interconexões de E/S
- E/S orientada por interrupção
- acesso direto à memória (DMA)
- disco magnético e SSD
- controladores de dispositivo
- RAID e redundância
- confiabilidade de armazenamento e MTTF
- virtualização de E/S
- taxa de transferência e latência
- E/S mapeada na memória
Key theories
- Conjuntos redundantes de discos independentes (RAID)
- A combinação de muitos discos comerciais com striping de dados e paridade ou espelhamento resulta em armazenamento que é maior, mais rápido e mais confiável do que um único disco; os níveis de RAID formalizam as compensações entre capacidade, desempenho e tolerância a falhas.
- Transferência de E/S desacoplada
- O acesso direto à memória e a E/S orientada por interrupção permitem que os dispositivos transfiram dados de e para a memória sem o envolvimento contínuo do processador, sobrepondo a E/S com a computação e melhorando a taxa de transferência geral do sistema.
Mechanisms
Periféricos se conectam ao sistema através de barramentos e controladores e sinalizam o processador com interrupções. Grandes volumes de dados são movidos por acesso direto à memória (DMA), que transfere blocos entre um dispositivo e a memória sem o envolvimento do processador palavra por palavra. O armazenamento secundário armazena dados persistentemente em discos magnéticos ou flash, e arranjos de dispositivos usam striping, espelhamento e paridade (RAID) para melhorar o desempenho e tolerar falhas. Camadas de virtualização multiplexam esses dispositivos entre os convidados.
Clinical relevance
O armazenamento e a E/S frequentemente determinam o desempenho e a durabilidade do sistema de ponta a ponta: bancos de dados, servidores de arquivos e aplicações intensivas em dados são frequentemente limitados pela taxa de transferência e latência do armazenamento, em vez da computação. RAID e esquemas de redundância relacionados protegem contra falhas de dispositivos em data centers, e a virtualização eficiente de E/S é essencial para a computação em nuvem, onde muitos inquilinos compartilham hardware físico.
History
Máquinas antigas usavam E/S programada e canais dedicados; E/S orientada por interrupção e acesso direto à memória surgiram para sobrepor E/S com computação. Discos magnéticos dominaram o armazenamento secundário por décadas, e a proposta RAID de 1988 por Patterson, Gibson e Katz estabeleceu a redundância como uma técnica padrão de confiabilidade. Unidades de estado sólido baseadas em flash posteriormente remodelaram a hierarquia de armazenamento, e a virtualização de E/S tornou-se central com o surgimento da computação em nuvem.
Debates
- Armazenamento desagregado versus local
- Há uma discussão contínua sobre se o armazenamento deve ser anexado localmente à computação ou desagregado em redes rápidas; a desagregação melhora a utilização e a flexibilidade em data centers, mas adiciona latência e depende de interconexões de alto desempenho.
Key figures
- David A. Patterson
- Garth Gibson
- Randy H. Katz
- John L. Hennessy
Related topics
Seminal works
- hennessy2019
- patterson1988raid
- silberschatz2018
Frequently asked questions
- O que é acesso direto à memória e por que é útil?
- O acesso direto à memória (DMA) permite que um dispositivo transfira blocos de dados de ou para a memória principal sem que o processador copie cada palavra. Isso libera o processador para realizar outras tarefas durante a transferência, sobrepondo a E/S com a computação e melhorando significativamente a taxa de transferência para movimentação de grandes volumes de dados.
- O RAID garante que meus dados estão seguros?
- Não. O RAID melhora a disponibilidade e tolera certas falhas de dispositivos armazenando informações redundantes, mas não é um backup: ele não protege contra exclusão acidental, corrupção, falhas de múltiplos dispositivos além de sua tolerância ou desastres em nível de site, portanto, backups separados continuam sendo necessários.