Apache Tajo - Instalação

Para instalar o Apache Tajo, você deve ter o seguinte software em seu sistema -

  • Hadoop versão 2.3 ou superior
  • Java versão 1.7 ou superior
  • Linux ou Mac OS

Vamos agora continuar com os seguintes passos para instalar o Tajo.

Verificando a instalação do Java

Felizmente, você já instalou o Java versão 8 em sua máquina. Agora, você só precisa continuar verificando.

Para verificar, use o seguinte comando -

$ java -version

Se o Java for instalado com sucesso em sua máquina, você poderá ver a versão atual do Java instalado. Se o Java não estiver instalado, siga estas etapas para instalar o Java 8 em sua máquina.

Baixar JDK

Baixe a versão mais recente do JDK visitando o link a seguir e, em seguida, baixe a versão mais recente.

https://www.oracle.com

A última versão é JDK 8u 92 e o arquivo é “jdk-8u92-linux-x64.tar.gz”. Faça download do arquivo em sua máquina. Em seguida, extraia os arquivos e mova-os para um diretório específico. Agora, defina as alternativas Java. Finalmente, o Java é instalado em sua máquina.

Verificando a instalação do Hadoop

Você já instalou Hadoopem seu sistema. Agora, verifique-o usando o seguinte comando -

$ hadoop version

Se tudo estiver bem com sua configuração, você poderá ver a versão do Hadoop. Se o Hadoop não estiver instalado, baixe e instale o Hadoop visitando o seguinte link -https://www.apache.org

Instalação Apache Tajo

O Apache Tajo fornece dois modos de execução - modo local e modo totalmente distribuído. Após verificar a instalação do Java e do Hadoop, prossiga com as etapas a seguir para instalar o cluster Tajo em sua máquina. Uma instância Tajo no modo local requer configurações muito fáceis.

Baixe a versão mais recente do Tajo visitando o seguinte link - https://www.apache.org/dyn/closer.cgi/tajo

Agora você pode baixar o arquivo “tajo-0.11.3.tar.gz” de sua máquina.

Extrair arquivo tar

Extraia o arquivo tar usando o seguinte comando -

$ cd opt/ 
$ tar tajo-0.11.3.tar.gz 
$ cd tajo-0.11.3

Definir Variável de Ambiente

Adicione as seguintes alterações a “conf/tajo-env.sh” Arquivo

$ cd tajo-0.11.3 
$ vi conf/tajo-env.sh
 
# Hadoop home. Required 
export HADOOP_HOME = /Users/path/to/Hadoop/hadoop-2.6.2
 
# The java implementation to use.  Required. 
export JAVA_HOME = /path/to/jdk1.8.0_92.jdk/

Aqui, você deve especificar o caminho Hadoop e Java para “tajo-env.sh”Arquivo. Depois que as alterações forem feitas, salve o arquivo e saia do terminal.

Iniciar servidor Tajo

Para iniciar o servidor Tajo, execute o seguinte comando -

$ bin/start-tajo.sh

Você receberá uma resposta semelhante à seguinte -

Starting single TajoMaster 
starting master, logging to /Users/path/to/Tajo/tajo-0.11.3/bin/../ 
localhost: starting worker, logging to /Users/path/toe/Tajo/tajo-0.11.3/bin/../logs/
 
Tajo master web UI: http://local:26080 
Tajo Client Service: local:26002

Agora, digite o comando “jps” para ver os daemons em execução.

$ jps  
1010 TajoWorker 
1140 Jps 
933 TajoMaster

Lançar Tajo Shell (Tsql)

Para iniciar o cliente shell Tajo, use o seguinte comando -

$ bin/tsql

Você receberá a seguinte saída -

welcome to
   _____ ___  _____ ___ 
  /_  _/ _  |/_  _/   / 
   / // /_| |_/ // / / 
  /_//_/ /_/___/ \__/  0.11.3
  
Try \? for help.

Saia da Tajo Shell

Execute o seguinte comando para sair do Tsql -

default> \q 
bye!

Aqui, o padrão se refere ao catálogo no Tajo.

IU da web

Digite o seguinte URL para iniciar a IU da web do Tajo - http://localhost:26080/

Agora você verá a tela a seguir, que é semelhante à opção ExecuteQuery.

Pare Tajo

Para parar o servidor Tajo, use o seguinte comando -

$ bin/stop-tajo.sh

Você receberá a seguinte resposta -

localhost: stopping worker 
stopping master