Data Warehousing - Perguntas da entrevista

Caros leitores, estes Data Warehousing Interview Questions foram concebidos especialmente para que você se familiarize com a natureza das perguntas que você pode encontrar durante a entrevista sobre o assunto Data Warehousing.

Q: Define data warehouse?

A : Data warehouse é uma coleção de dados orientada ao assunto, integrada, variável no tempo e não volátil que oferece suporte ao processo de tomada de decisão da administração.

Q: What does subject-oriented data warehouse signify?

A : Orientado ao assunto significa que o data warehouse armazena as informações em torno de um assunto específico, como produto, cliente, vendas, etc.

Q: List any five applications of data warehouse.

A : Alguns aplicativos incluem serviços financeiros, serviços bancários, bens de clientes, setores de varejo, manufatura controlada.

Q: What do OLAP and OLTP stand for?

A : OLAP é um acrônimo para Online Analytical Processing e OLTP é um acrônimo de Online Transactional Processing.

Q: What is the very basic difference between data warehouse and operational databases?

A : Um data warehouse contém informações históricas que são disponibilizadas para análise do negócio, enquanto um banco de dados operacional contém informações atuais que são necessárias para administrar o negócio.

Q: List the Schema that a data warehouse system can implements.

A : Um data warehouse pode implementar o esquema em estrela, o esquema em floco de neve e o esquema de constelação de fatos.

Q: What is Data Warehousing?

A : Data Warehousing é o processo de construção e uso do data warehouse.

Q: List the process that are involved in Data Warehousing.

A : Data Warehousing envolve limpeza de dados, integração de dados e consolidações de dados.

Q: List the functions of data warehouse tools and utilities.

A : As funções executadas pela ferramenta e utilitários de data warehouse são Extração de Dados, Limpeza de Dados, Transformação de Dados, Carregamento e Atualização de Dados.

Q: What do you mean by Data Extraction?

A : Extração de dados significa reunir dados de várias fontes heterogêneas.

Q: Define metadata?

A: Metadados são simplesmente definidos como dados sobre dados. Em outras palavras, podemos dizer que metadados são os dados resumidos que nos conduzem aos dados detalhados.

Q: What does Metadata Respiratory contain?

A : Os metadados respiratórios contêm a definição de data warehouse, metadados de negócios, metadados operacionais, dados para mapeamento do ambiente operacional para data warehouse e os algoritmos para sumarização.

Q: How does a Data Cube help?

A: O cubo de dados nos ajuda a representar os dados em várias dimensões. O cubo de dados é definido por dimensões e fatos.

Q: Define dimension?

A : As dimensões são as entidades com relação às quais uma empresa mantém os registros.

Q: Explain data mart.

A: Data mart contém o subconjunto de dados de toda a organização. Este subconjunto de dados é valioso para grupos específicos de uma organização. Em outras palavras, podemos dizer que um data mart contém dados específicos para um determinado grupo.

Q: What is Virtual Warehouse?

A : A visão de um armazém de dados operacional é conhecida como armazém virtual.

Q: List the phases involved in the data warehouse delivery process.

A : Os estágios são estratégia de TI, educação, análise de caso de negócios, projeto técnico, construção da versão, carregamento de histórico, consulta ad hoc, evolução de requisitos, automação e escopo estendido.

Q: Define load manager.

A: Um gerenciador de carga executa as operações necessárias para extrair e carregar o processo. O tamanho e a complexidade do gerenciador de carga variam entre soluções específicas de data warehouse para data warehouse.

Q: Define the functions of a load manager.

A: Um gerenciador de carga extrai dados do sistema de origem. Carregar rapidamente os dados extraídos no armazenamento de dados temporário. Execute transformações simples em uma estrutura semelhante àquela do data warehouse.

Q: Define a warehouse manager.

A: O gerente de armazém é responsável pelo processo de gerenciamento de armazém. O gerenciador de warehouse consiste em software de sistema de terceiros, programas C e scripts de shell. O tamanho e a complexidade do gerente de warehouse variam entre soluções específicas.

Q: Define the functions of a warehouse manager.

A : O gerente do warehouse realiza verificações de consistência e integridade referencial, cria os índices, visões de negócios, visões de partição contra os dados de base, transforma e mescla os dados de origem no armazenamento temporário no armazém de dados publicado, faz backup dos dados no armazém de dados, e arquiva os dados que chegaram ao fim de sua vida capturada.

Q: What is Summary Information?

A : Informações de resumo é a área do armazém de dados onde as agregações predefinidas são mantidas.

Q: What does the Query Manager responsible for?

A : O Query Manager é responsável por direcionar as consultas para as tabelas adequadas.

Q: List the types of OLAP server

A : Existem quatro tipos de servidores OLAP: Relational OLAP, Multidimensional OLAP, Hybrid OLAP e Specialized SQL Servers.

Q: Which one is faster, Multidimensional OLAP or Relational OLAP?

A : OLAP multidimensional é mais rápido do que OLAP relacional.

Q: List the functions performed by OLAP.

A : OLAP executa funções como roll-up, drill down, slice, dice e pivô.

Q: How many dimensions are selected in Slice operation?

A : Apenas uma dimensão é selecionada para a operação de fatia.

Q: How many dimensions are selected in dice operation?

A : Para operação de dados, duas ou mais dimensões são selecionadas para um dado cubo.

Q: How many fact tables are there in a star schema?

A : Há apenas uma tabela de fatos em um Esquema em estrela.

Q: What is Normalization?

A : A normalização divide os dados em tabelas adicionais.

Q: Out of star schema and snowflake schema, whose dimension table is normalized?

A : O esquema do floco de neve usa o conceito de normalização.

Q: What is the benefit of normalization?

A : A normalização ajuda a reduzir a redundância de dados.

Q: Which language is used for defining Schema Definition?

A : Data Mining Query Language (DMQL) é usado para definição de esquema.

Q: What language is the base of DMQL?

A : DMQL é baseado em Structured Query Language (SQL).

Q: What are the reasons for partitioning?

A : O particionamento é feito por vários motivos, como fácil gerenciamento, para ajudar na recuperação do backup e para melhorar o desempenho.

Q: What kind of costs are involved in Data Marting?

A : Data Marting envolve custo de hardware e software, custo de acesso à rede e custo de tempo.