Data Warehouse - Esquemas
Um esquema é definido como uma descrição lógica do banco de dados em que as tabelas de fatos e dimensões são unidas de maneira lógica. O data warehouse é mantido na forma de esquema Star, Snow flakes e Fact Constellation.
Esquema Star
Um esquema Star contém uma tabela de fatos e várias tabelas de dimensão. Cada dimensão é representada com apenas uma tabela de dimensão e eles não são normalizados. A tabela de dimensões contém um conjunto de atributos.
Características
- Em um esquema Star, há apenas uma tabela de fatos e várias tabelas de dimensão.
- Em um esquema em estrela, cada dimensão é representada por uma tabela de uma dimensão.
- As tabelas de dimensão não são normalizadas em um esquema Star.
- Cada tabela de dimensão é unida a uma chave em uma tabela de fatos.
A ilustração a seguir mostra os dados de vendas de uma empresa em relação às quatro dimensões, ou seja, Tempo, Item, Filial e Local.
Há uma tabela de fatos no centro. Ele contém as chaves para cada uma das quatro dimensões. A tabela de fatos também contém os atributos, ou seja, dólares vendidos e unidades vendidas.
Note- Cada dimensão possui apenas uma tabela de dimensão e cada tabela contém um conjunto de atributos. Por exemplo, a tabela de dimensão de localização contém o conjunto de atributos {location_key, street, city, province_or_state, country}. Essa restrição pode causar redundância de dados.
For example- "Vancouver" e "Victoria" ambas as cidades estão na província canadense de British Columbia. As entradas para tais cidades podem causar redundância de dados ao longo dos atributos province_or_state e country.
Esquema de flocos de neve
Algumas tabelas de dimensão no esquema Snowflake são normalizadas. A normalização divide os dados em tabelas adicionais, conforme mostrado na ilustração a seguir.
Ao contrário do esquema Star, a tabela da dimensão em um esquema em floco de neve é normalizada.
For example- A tabela de dimensão de item em um esquema em estrela é normalizada e dividida em duas tabelas de dimensão, ou seja, tabela de item e fornecedor. Agora, a tabela de dimensão do item contém os atributos item_key, item_name, type, brand, and supplies-key.
A chave do fornecedor está vinculada à tabela de dimensão do fornecedor. A tabela de dimensões do fornecedor contém os atributos chave_de_fornecedor e tipo_de_fornecedor.
Note - Devido à normalização no esquema Snowflake, a redundância é reduzida e, portanto, torna-se fácil manter e economizar espaço de armazenamento.
Esquema de constelação de fatos (esquema de galáxia)
Uma constelação de fatos possui várias tabelas de fatos. Também é conhecido como esquema de galáxia.
A ilustração a seguir mostra duas tabelas de fatos, nomeadamente Vendas e Envio -
A tabela de fatos de vendas é igual à do Esquema Star. A tabela de fatos de envio tem cinco dimensões, a saber item_key, time_key, shipper_key, from_location, to_location. A tabela de fatos de envio também contém duas medidas, ou seja, dólares vendidos e unidades vendidas. Também é possível compartilhar tabelas de dimensão entre tabelas de fatos.
For example - As tabelas de dimensão de tempo, item e local são compartilhadas entre a tabela de fatos de vendas e remessa.