HCatalog - índices

Criação de um índice

Um índice nada mais é que um ponteiro para uma coluna específica de uma tabela. Criar um índice significa criar um ponteiro em uma coluna específica de uma tabela. Sua sintaxe é a seguinte -

CREATE INDEX index_name
ON TABLE base_table_name (col_name, ...)
AS 'index.handler.class.name'
[WITH DEFERRED REBUILD]
[IDXPROPERTIES (property_name = property_value, ...)]
[IN TABLE index_table_name]
[PARTITIONED BY (col_name, ...)][
   [ ROW FORMAT ...] STORED AS ...
   | STORED BY ...
]
[LOCATION hdfs_path]
[TBLPROPERTIES (...)]

Exemplo

Tomemos um exemplo para entender o conceito de índice. Use o mesmoemployee tabela que usamos anteriormente com os campos Id, Nome, Salário, Designação e Departamento. Crie um índice chamado index_salary no salary coluna do employee mesa.

A consulta a seguir cria um índice -

./hcat –e "CREATE INDEX inedx_salary ON TABLE employee(salary)
AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler';"

É um indicador para o salarycoluna. Se a coluna for modificada, as alterações serão armazenadas usando um valor de índice.

Descartando um índice

A seguinte sintaxe é usada para descartar um índice -

DROP INDEX <index_name> ON <table_name>

A consulta a seguir elimina o índice index_salary -

./hcat –e "DROP INDEX index_salary ON employee;"