Apache Tajo - Instalação
Para instalar o Apache Tajo, você deve ter o seguinte software em seu sistema -
- Hadoop versão 2.3 ou superior
- Java versão 1.7 ou superior
- Linux ou Mac OS
Vamos agora continuar com os seguintes passos para instalar o Tajo.
Verificando a instalação do Java
Felizmente, você já instalou o Java versão 8 em sua máquina. Agora, você só precisa continuar verificando.
Para verificar, use o seguinte comando -
$ java -version
Se o Java for instalado com sucesso em sua máquina, você poderá ver a versão atual do Java instalado. Se o Java não estiver instalado, siga estas etapas para instalar o Java 8 em sua máquina.
Baixar JDK
Baixe a versão mais recente do JDK visitando o link a seguir e, em seguida, baixe a versão mais recente.
A última versão é JDK 8u 92 e o arquivo é “jdk-8u92-linux-x64.tar.gz”. Faça download do arquivo em sua máquina. Em seguida, extraia os arquivos e mova-os para um diretório específico. Agora, defina as alternativas Java. Finalmente, o Java é instalado em sua máquina.
Verificando a instalação do Hadoop
Você já instalou Hadoopem seu sistema. Agora, verifique-o usando o seguinte comando -
$ hadoop version
Se tudo estiver bem com sua configuração, você poderá ver a versão do Hadoop. Se o Hadoop não estiver instalado, baixe e instale o Hadoop visitando o seguinte link -https://www.apache.org
Instalação Apache Tajo
O Apache Tajo fornece dois modos de execução - modo local e modo totalmente distribuído. Após verificar a instalação do Java e do Hadoop, prossiga com as etapas a seguir para instalar o cluster Tajo em sua máquina. Uma instância Tajo no modo local requer configurações muito fáceis.
Baixe a versão mais recente do Tajo visitando o seguinte link - https://www.apache.org/dyn/closer.cgi/tajo
Agora você pode baixar o arquivo “tajo-0.11.3.tar.gz” de sua máquina.
Extrair arquivo tar
Extraia o arquivo tar usando o seguinte comando -
$ cd opt/
$ tar tajo-0.11.3.tar.gz
$ cd tajo-0.11.3
Definir Variável de Ambiente
Adicione as seguintes alterações a “conf/tajo-env.sh” Arquivo
$ cd tajo-0.11.3
$ vi conf/tajo-env.sh
# Hadoop home. Required
export HADOOP_HOME = /Users/path/to/Hadoop/hadoop-2.6.2
# The java implementation to use. Required.
export JAVA_HOME = /path/to/jdk1.8.0_92.jdk/
Aqui, você deve especificar o caminho Hadoop e Java para “tajo-env.sh”Arquivo. Depois que as alterações forem feitas, salve o arquivo e saia do terminal.
Iniciar servidor Tajo
Para iniciar o servidor Tajo, execute o seguinte comando -
$ bin/start-tajo.sh
Você receberá uma resposta semelhante à seguinte -
Starting single TajoMaster
starting master, logging to /Users/path/to/Tajo/tajo-0.11.3/bin/../
localhost: starting worker, logging to /Users/path/toe/Tajo/tajo-0.11.3/bin/../logs/
Tajo master web UI: http://local:26080
Tajo Client Service: local:26002
Agora, digite o comando “jps” para ver os daemons em execução.
$ jps
1010 TajoWorker
1140 Jps
933 TajoMaster
Lançar Tajo Shell (Tsql)
Para iniciar o cliente shell Tajo, use o seguinte comando -
$ bin/tsql
Você receberá a seguinte saída -
welcome to
_____ ___ _____ ___
/_ _/ _ |/_ _/ /
/ // /_| |_/ // / /
/_//_/ /_/___/ \__/ 0.11.3
Try \? for help.
Saia da Tajo Shell
Execute o seguinte comando para sair do Tsql -
default> \q
bye!
Aqui, o padrão se refere ao catálogo no Tajo.
IU da web
Digite o seguinte URL para iniciar a IU da web do Tajo - http://localhost:26080/
Agora você verá a tela a seguir, que é semelhante à opção ExecuteQuery.
Pare Tajo
Para parar o servidor Tajo, use o seguinte comando -
$ bin/stop-tajo.sh
Você receberá a seguinte resposta -
localhost: stopping worker
stopping master