Data Warehouse - Esquemas

Um esquema é definido como uma descrição lógica do banco de dados em que as tabelas de fatos e dimensões são unidas de maneira lógica. O data warehouse é mantido na forma de esquema Star, Snow flakes e Fact Constellation.

Esquema Star

Um esquema Star contém uma tabela de fatos e várias tabelas de dimensão. Cada dimensão é representada com apenas uma tabela de dimensão e eles não são normalizados. A tabela de dimensões contém um conjunto de atributos.

Características

  • Em um esquema Star, há apenas uma tabela de fatos e várias tabelas de dimensão.
  • Em um esquema em estrela, cada dimensão é representada por uma tabela de uma dimensão.
  • As tabelas de dimensão não são normalizadas em um esquema Star.
  • Cada tabela de dimensão é unida a uma chave em uma tabela de fatos.

A ilustração a seguir mostra os dados de vendas de uma empresa em relação às quatro dimensões, ou seja, Tempo, Item, Filial e Local.

Há uma tabela de fatos no centro. Ele contém as chaves para cada uma das quatro dimensões. A tabela de fatos também contém os atributos, ou seja, dólares vendidos e unidades vendidas.

Note- Cada dimensão possui apenas uma tabela de dimensão e cada tabela contém um conjunto de atributos. Por exemplo, a tabela de dimensão de localização contém o conjunto de atributos {location_key, street, city, province_or_state, country}. Essa restrição pode causar redundância de dados.

For example- "Vancouver" e "Victoria" ambas as cidades estão na província canadense de British Columbia. As entradas para tais cidades podem causar redundância de dados ao longo dos atributos province_or_state e country.

Esquema de flocos de neve

Algumas tabelas de dimensão no esquema Snowflake são normalizadas. A normalização divide os dados em tabelas adicionais, conforme mostrado na ilustração a seguir.

Ao contrário do esquema Star, a tabela da dimensão em um esquema em floco de neve é ​​normalizada.

For example- A tabela de dimensão de item em um esquema em estrela é normalizada e dividida em duas tabelas de dimensão, ou seja, tabela de item e fornecedor. Agora, a tabela de dimensão do item contém os atributos item_key, item_name, type, brand, and supplies-key.

A chave do fornecedor está vinculada à tabela de dimensão do fornecedor. A tabela de dimensões do fornecedor contém os atributos chave_de_fornecedor e tipo_de_fornecedor.

Note - Devido à normalização no esquema Snowflake, a redundância é reduzida e, portanto, torna-se fácil manter e economizar espaço de armazenamento.

Esquema de constelação de fatos (esquema de galáxia)

Uma constelação de fatos possui várias tabelas de fatos. Também é conhecido como esquema de galáxia.

A ilustração a seguir mostra duas tabelas de fatos, nomeadamente Vendas e Envio -

A tabela de fatos de vendas é igual à do Esquema Star. A tabela de fatos de envio tem cinco dimensões, a saber item_key, time_key, shipper_key, from_location, to_location. A tabela de fatos de envio também contém duas medidas, ou seja, dólares vendidos e unidades vendidas. Também é possível compartilhar tabelas de dimensão entre tabelas de fatos.

For example - As tabelas de dimensão de tempo, item e local são compartilhadas entre a tabela de fatos de vendas e remessa.