o distinct operador no Impala é usado para obter os valores exclusivos, removendo duplicatas.
Sintaxe
A seguir está a sintaxe do distinct operador.
select distinct columns… from table_name;
Exemplo
Suponha que temos uma tabela chamada customers no Impala e seus conteúdos são os seguintes -
[quickstart.cloudera:21000] > select distinct id, name, age, salary from customers;
Query: select distinct id, name, age, salary from customers
Aqui você pode observar o salário dos clientes Ramesh e Chaitali cadastrados duas vezes e utilizando o distinct operador, podemos selecionar os valores exclusivos conforme mostrado abaixo.
[quickstart.cloudera:21000] > select distinct name, age, address from customers;
Na execução, a consulta acima fornece a seguinte saída.
Query: select distinct id, name from customers
+----------+-----+-----------+
| name | age | address |
+----------+-----+-----------+
| Ramesh | 32 | Ahmedabad |
| Khilan | 25 | Delhi |
| kaushik | 23 | Kota |
| Chaitali | 25 | Mumbai |
| Hardik | 27 | Bhopal |
| Komal | 22 | MP |
+----------+-----+-----------+
Fetched 9 row(s) in 1.46s