SAP HANA - Esquema em Data Warehouse

Os esquemas são descrições lógicas de tabelas no Data Warehouse. Os esquemas são criados pela união de várias tabelas de fatos e dimensões para atender a alguma lógica de negócios.

O banco de dados usa um modelo relacional para armazenar dados. No entanto, o Data Warehouse usa esquemas que unem dimensões e tabelas de fatos para atender à lógica de negócios. Existem três tipos de esquemas usados ​​em um data warehouse -

  • Esquema Star
  • Esquema de flocos de neve
  • Galaxy Schema

Esquema Star

No esquema Star, cada dimensão é unida a uma única tabela de fatos. Cada dimensão é representada por apenas uma dimensão e não é mais normalizada.

Tabela de dimensão contém um conjunto de atributos que são usados ​​para analisar os dados.

Example - No exemplo dado abaixo, temos uma tabela de fatos FactSales que tem chaves primárias para todas as tabelas Dim e mede unidades_vendidas e dólares_vendidos para fazer a análise.

Temos quatro tabelas de dimensão - DimTime, DimItem, DimBranch, DimLocation

Cada tabela de dimensão é conectada à tabela de fatos, pois a tabela de fatos tem a chave primária para cada tabela de dimensão que é usada para unir duas tabelas.

Os fatos / medidas na tabela de fatos são usados ​​para fins de análise junto com os atributos nas tabelas de dimensão.

Esquema de flocos de neve

No esquema de flocos de neve, algumas das tabelas de dimensão são mais além, normalizadas e tabelas Dim são conectadas a uma única Tabela de fatos. A normalização é usada para organizar atributos e tabelas de banco de dados para minimizar a redundância de dados.

A normalização envolve quebrar uma tabela em tabelas menores menos redundantes sem perder qualquer informação e tabelas menores são unidas à tabela de dimensão.

No exemplo acima, as tabelas DimItem e DimLocation Dimension são normalizadas sem perder nenhuma informação. Isso é chamado de esquema de flocos de neve, em que as tabelas de dimensão são posteriormente normalizadas para tabelas menores.

Galaxy Schema

No Galaxy Schema, existem várias tabelas de fatos e tabelas de dimensão. Cada tabela de fatos armazena chaves primárias de poucas tabelas de dimensão e medidas / fatos para fazer análise.

No exemplo acima, existem duas tabelas de fatos, FactSales, FactShipping e várias tabelas de dimensão unidas às tabelas de fatos. Cada tabela de fatos contém a chave primária para tabelas Dim unidas e medidas / fatos para realizar análises.