DBMS - Sistema de Armazenamento

Os bancos de dados são armazenados em formatos de arquivo, que contêm registros. No nível físico, os dados reais são armazenados em formato eletromagnético em algum dispositivo. Esses dispositivos de armazenamento podem ser amplamente categorizados em três tipos -

  • Primary Storage- O armazenamento de memória que é diretamente acessível à CPU se enquadra nesta categoria. A memória interna (registros), a memória rápida (cache) e a memória principal (RAM) da CPU são diretamente acessíveis à CPU, pois estão todas localizadas na placa-mãe ou no chipset da CPU. Esse armazenamento é normalmente muito pequeno, ultrarrápido e volátil. O armazenamento primário requer fonte de alimentação contínua para manter seu estado. Em caso de falha de energia, todos os seus dados são perdidos.

  • Secondary Storage- Dispositivos de armazenamento secundário são usados ​​para armazenar dados para uso futuro ou como backup. O armazenamento secundário inclui dispositivos de memória que não fazem parte do chipset da CPU ou da placa-mãe, por exemplo, discos magnéticos, discos ópticos (DVD, CD, etc.), discos rígidos, drives flash e fitas magnéticas.

  • Tertiary Storage- O armazenamento terciário é usado para armazenar grandes volumes de dados. Como esses dispositivos de armazenamento são externos ao sistema do computador, eles são os mais lentos em velocidade. Esses dispositivos de armazenamento são usados ​​principalmente para fazer o backup de um sistema inteiro. Discos ópticos e fitas magnéticas são amplamente usados ​​como armazenamento terciário.

Hierarquia de Memória

Um sistema de computador possui uma hierarquia de memória bem definida. Uma CPU tem acesso direto à sua memória principal, bem como aos seus registros embutidos. O tempo de acesso da memória principal é obviamente menor que a velocidade da CPU. Para minimizar essa incompatibilidade de velocidade, a memória cache é introduzida. A memória cache fornece o tempo de acesso mais rápido e contém dados que são acessados ​​com mais frequência pela CPU.

A memória com acesso mais rápido é a mais cara. Dispositivos de armazenamento maiores oferecem velocidade lenta e são menos caros, no entanto, podem armazenar grandes volumes de dados em comparação com os registros da CPU ou memória cache.

Discos Magnéticos

As unidades de disco rígido são os dispositivos de armazenamento secundário mais comuns nos sistemas de computador atuais. Eles são chamados de discos magnéticos porque usam o conceito de magnetização para armazenar informações. Os discos rígidos consistem em discos de metal revestidos com material magnetizável. Esses discos são colocados verticalmente em um eixo. Um cabeçote de leitura / gravação se move entre os discos e é usado para magnetizar ou desmagnetizar o ponto sob ele. Um ponto magnetizado pode ser reconhecido como 0 (zero) ou 1 (um).

Os discos rígidos são formatados em uma ordem bem definida para armazenar dados com eficiência. Uma placa de disco rígido tem muitos círculos concêntricos, chamadostracks. Cada trilha é dividida emsectors. Um setor em um disco rígido normalmente armazena 512 bytes de dados.

Matriz redundante de discos independentes

RAID ou Redundante Asérie de Iindependente Disks, é uma tecnologia para conectar vários dispositivos de armazenamento secundários e usá-los como uma única mídia de armazenamento.

O RAID consiste em uma matriz de discos em que vários discos são conectados para atingir objetivos diferentes. Os níveis de RAID definem o uso de matrizes de disco.

RAID 0

Nesse nível, uma matriz distribuída de discos é implementada. Os dados são divididos em blocos e os blocos são distribuídos entre os discos. Cada disco recebe um bloco de dados para escrever / ler em paralelo. Ele aumenta a velocidade e o desempenho do dispositivo de armazenamento. Não há paridade e backup no Nível 0.

RAID 1

RAID 1 usa técnicas de espelhamento. Quando os dados são enviados para um controlador RAID, ele envia uma cópia dos dados para todos os discos da matriz. RAID nível 1 também é chamadomirroring e fornece 100% de redundância em caso de falha.

RAID 2

O RAID 2 registra o código de correção de erro usando a distância de Hamming para seus dados, distribuídos em discos diferentes. Como no nível 0, cada bit de dados em uma palavra é gravado em um disco separado e os códigos ECC das palavras de dados são armazenados em um conjunto de discos diferente. Devido à sua estrutura complexa e alto custo, o RAID 2 não está disponível comercialmente.

RAID 3

O RAID 3 distribui os dados em vários discos. O bit de paridade gerado para a palavra de dados é armazenado em um disco diferente. Essa técnica permite superar as falhas de um único disco.

RAID 4

Nesse nível, um bloco inteiro de dados é gravado em discos de dados e, em seguida, a paridade é gerada e armazenada em um disco diferente. Observe que o nível 3 usa distribuição em nível de byte, enquanto o nível 4 usa distribuição em nível de bloco. Os níveis 3 e 4 requerem pelo menos três discos para implementar o RAID.

RAID 5

O RAID 5 grava blocos de dados inteiros em discos diferentes, mas os bits de paridade gerados para a fração do bloco de dados são distribuídos entre todos os discos de dados, em vez de armazená-los em um disco dedicado diferente.

RAID 6

O RAID 6 é uma extensão do nível 5. Nesse nível, duas paridades independentes são geradas e armazenadas de maneira distribuída entre vários discos. Duas paridades fornecem tolerância a falhas adicional. Este nível requer pelo menos quatro unidades de disco para implementar o RAID.