Apache Tajo é uma estrutura de data warehouse distribuída de código aberto para Hadoop. Tajo foi inicialmente fundado por Gruter, uma empresa de infraestrutura baseada em Hadoop na Coréia do Sul. Mais tarde, especialistas da Intel, Etsy, NASA, Cloudera, Hortonworks também contribuíram para o projeto. Tajo se refere a um avestruz na língua coreana. No ano de março de 2014, Tajo recebeu um projeto Apache de código aberto de alto nível. Este tutorial explorará os fundamentos do Tajo e, em seguida, explicará a configuração do cluster, shell Tajo, consultas SQL, integração com outras tecnologias de big data e, finalmente, concluirá com alguns exemplos.
Antes de prosseguir com este tutorial, você deve ter um conhecimento sólido no núcleo do Java, qualquer um dos sistemas operacionais Linux e DBMS.
Este tutorial foi preparado para profissionais que desejam fazer carreira em análise de big data. Este tutorial fornecerá conhecimento suficiente sobre o Apache Tajo.