Apache Presto - conector HIVE

O conector Hive permite consultar dados armazenados em um data warehouse Hive.

Pré-requisitos

  • Hadoop
  • Hive

Esperançosamente, você instalou o Hadoop e o Hive em sua máquina. Inicie todos os serviços um por um no novo terminal. Em seguida, inicie o hive metastore usando o seguinte comando,

hive --service metastore

O Presto usa o serviço metastore do Hive para obter os detalhes da tabela da colmeia.

Definições de configuração

Crie um arquivo “hive.properties” debaixo “etc/catalog”diretório. Use o seguinte comando.

$ cd etc 
$ cd catalog 
$ vi hive.properties  

connector.name = hive-cdh4 
hive.metastore.uri = thrift://localhost:9083

Depois de fazer todas as alterações, salve o arquivo e saia do terminal.

Criar banco de dados

Crie um banco de dados no Hive usando a seguinte consulta -

Inquerir

hive> CREATE SCHEMA tutorials;

Depois que o banco de dados é criado, você pode verificá-lo usando o “show databases” comando.

Criar a tabela

Criar tabela é uma instrução usada para criar uma tabela no Hive. Por exemplo, use a seguinte consulta.

hive> create table author(auth_id int, auth_name varchar(50), 
topic varchar(100) STORED AS SEQUENCEFILE;

Insira a tabela

A consulta a seguir é usada para inserir registros na tabela do hive.

hive> insert into table author values (1,’ Doug Cutting’,Hadoop),
(2,’ James Gosling’,java),(3,’ Dennis Ritchie’,C);

Iniciar Presto CLI

Você pode iniciar o Presto CLI para conectar o plugin de armazenamento Hive usando o seguinte comando.

$ ./presto --server localhost:8080 --catalog hive —schema tutorials;

Você receberá a seguinte resposta.

presto:tutorials >

Esquemas de lista

Para listar todos os esquemas no conector Hive, digite o seguinte comando.

Inquerir

presto:tutorials > show schemas from hive;

Resultado

default  

tutorials

Listar tabelas

Para listar todas as tabelas no esquema de “tutoriais”, use a seguinte consulta.

Inquerir

presto:tutorials > show tables from hive.tutorials;

Resultado

author

Buscar mesa

A consulta a seguir é usada para buscar todos os registros da tabela do hive.

Inquerir

presto:tutorials > select * from hive.tutorials.author;

Resultado

auth_id  |   auth_name    | topic 
---------+----------------+-------- 
       1 | Doug Cutting   | Hadoop 
       2 | James Gosling  | java 
       3 | Dennis Ritchie | C