Data Warehousing - Perguntas da entrevista
Caros leitores, estes Data Warehousing Interview Questions foram concebidos especialmente para que você se familiarize com a natureza das perguntas que você pode encontrar durante a entrevista sobre o assunto Data Warehousing.
A : Data warehouse é uma coleção de dados orientada ao assunto, integrada, variável no tempo e não volátil que oferece suporte ao processo de tomada de decisão da administração.
A : Orientado ao assunto significa que o data warehouse armazena as informações em torno de um assunto específico, como produto, cliente, vendas, etc.
A : Alguns aplicativos incluem serviços financeiros, serviços bancários, bens de clientes, setores de varejo, manufatura controlada.
A : OLAP é um acrônimo para Online Analytical Processing e OLTP é um acrônimo de Online Transactional Processing.
A : Um data warehouse contém informações históricas que são disponibilizadas para análise do negócio, enquanto um banco de dados operacional contém informações atuais que são necessárias para administrar o negócio.
A : Um data warehouse pode implementar o esquema em estrela, o esquema em floco de neve e o esquema de constelação de fatos.
A : Data Warehousing é o processo de construção e uso do data warehouse.
A : Data Warehousing envolve limpeza de dados, integração de dados e consolidações de dados.
A : As funções executadas pela ferramenta e utilitários de data warehouse são Extração de Dados, Limpeza de Dados, Transformação de Dados, Carregamento e Atualização de Dados.
A : Extração de dados significa reunir dados de várias fontes heterogêneas.
A: Metadados são simplesmente definidos como dados sobre dados. Em outras palavras, podemos dizer que metadados são os dados resumidos que nos conduzem aos dados detalhados.
A : Os metadados respiratórios contêm a definição de data warehouse, metadados de negócios, metadados operacionais, dados para mapeamento do ambiente operacional para data warehouse e os algoritmos para sumarização.
A: O cubo de dados nos ajuda a representar os dados em várias dimensões. O cubo de dados é definido por dimensões e fatos.
A : As dimensões são as entidades com relação às quais uma empresa mantém os registros.
A: Data mart contém o subconjunto de dados de toda a organização. Este subconjunto de dados é valioso para grupos específicos de uma organização. Em outras palavras, podemos dizer que um data mart contém dados específicos para um determinado grupo.
A : A visão de um armazém de dados operacional é conhecida como armazém virtual.
A : Os estágios são estratégia de TI, educação, análise de caso de negócios, projeto técnico, construção da versão, carregamento de histórico, consulta ad hoc, evolução de requisitos, automação e escopo estendido.
A: Um gerenciador de carga executa as operações necessárias para extrair e carregar o processo. O tamanho e a complexidade do gerenciador de carga variam entre soluções específicas de data warehouse para data warehouse.
A: Um gerenciador de carga extrai dados do sistema de origem. Carregar rapidamente os dados extraídos no armazenamento de dados temporário. Execute transformações simples em uma estrutura semelhante àquela do data warehouse.
A: O gerente de armazém é responsável pelo processo de gerenciamento de armazém. O gerenciador de warehouse consiste em software de sistema de terceiros, programas C e scripts de shell. O tamanho e a complexidade do gerente de warehouse variam entre soluções específicas.
A : O gerente do warehouse realiza verificações de consistência e integridade referencial, cria os índices, visões de negócios, visões de partição contra os dados de base, transforma e mescla os dados de origem no armazenamento temporário no armazém de dados publicado, faz backup dos dados no armazém de dados, e arquiva os dados que chegaram ao fim de sua vida capturada.
A : Informações de resumo é a área do armazém de dados onde as agregações predefinidas são mantidas.
A : O Query Manager é responsável por direcionar as consultas para as tabelas adequadas.
A : Existem quatro tipos de servidores OLAP: Relational OLAP, Multidimensional OLAP, Hybrid OLAP e Specialized SQL Servers.
A : OLAP multidimensional é mais rápido do que OLAP relacional.
A : OLAP executa funções como roll-up, drill down, slice, dice e pivô.
A : Apenas uma dimensão é selecionada para a operação de fatia.
A : Para operação de dados, duas ou mais dimensões são selecionadas para um dado cubo.
A : Há apenas uma tabela de fatos em um Esquema em estrela.
A : A normalização divide os dados em tabelas adicionais.
A : O esquema do floco de neve usa o conceito de normalização.
A : A normalização ajuda a reduzir a redundância de dados.
A : Data Mining Query Language (DMQL) é usado para definição de esquema.
A : DMQL é baseado em Structured Query Language (SQL).
A : O particionamento é feito por vários motivos, como fácil gerenciamento, para ajudar na recuperação do backup e para melhorar o desempenho.
A : Data Marting envolve custo de hardware e software, custo de acesso à rede e custo de tempo.