Impala é o banco de dados analítico nativo de código aberto do Apache Hadoop. Ele é enviado por fornecedores como Cloudera, MapR, Oracle e Amazon. Os exemplos fornecidos neste tutorial foram desenvolvidos usando Cloudera Impala
Este tutorial é direcionado para aqueles que desejam aprender o Impala. O Impala é usado para processar grandes volumes de dados na velocidade da luz usando o conhecimento tradicional de SQL.
Para aproveitar ao máximo este tutorial, você deve ter um bom entendimento dos princípios básicos dos comandos Hadoop e HDFS. Também é recomendável ter um conhecimento básico de SQL antes de seguir este tutorial.