Hive - funções integradas

Este capítulo explica as funções integradas disponíveis no Hive. As funções parecem bastante semelhantes às funções SQL, exceto pelo seu uso.

Funções integradas

O Hive oferece suporte às seguintes funções integradas:

Tipo de Devolução Assinatura Descrição
BIGINT rodada (duplo a) Ele retorna o valor BIGINT arredondado do duplo.
BIGINT andar (duplo a) Ele retorna o valor máximo de BIGINT que é igual ou menor que o dobro.
BIGINT teto (duplo a) Ele retorna o valor mínimo de BIGINT que é igual ou maior que o dobro.
em dobro rand (), rand (semente interna) Ele retorna um número aleatório que muda de linha para linha.
corda concat (string A, string B, ...) Ele retorna a string resultante da concatenação de B após A.
corda substr (string A, início interno) Ele retorna a substring de A começando da posição inicial até o final da string A.
corda substr (string A, início interno, comprimento interno) Ele retorna a substring de A começando da posição inicial com o comprimento fornecido.
corda superior (corda A) Ele retorna a string resultante da conversão de todos os caracteres de A em maiúsculas.
corda ucase (string A) O mesmo que acima.
corda inferior (string A) Ele retorna a string resultante da conversão de todos os caracteres de B em minúsculas.
corda lcase (string A) O mesmo que acima.
corda trim (string A) Ele retorna a string resultante do corte de espaços de ambas as extremidades de A.
corda ltrim (string A) Ele retorna a string resultante do corte de espaços do início (lado esquerdo) de A.
corda rtrim (string A) rtrim (string A) Retorna a string resultante do corte de espaços do final (lado direito) de A.
corda regexp_replace (string A, string B, string C) Ele retorna a string resultante da substituição de todas as substrings em B que correspondem à sintaxe da expressão regular Java com C.
int tamanho (Mapa <KV>) Ele retorna o número de elementos no tipo de mapa.
int tamanho (Array <T>) Ele retorna o número de elementos no tipo de matriz.
valor de <tipo> elenco (<expr> como <tipo>) Ele converte os resultados da expressão expr em <tipo>, por exemplo, cast ('1' como BIGINT) converte a string '1' em sua representação integral. Um NULL é retornado se a conversão não for bem-sucedida.
corda from_unixtime (int unixtime) converter o número de segundos da época Unix (1970-01-01 00:00:00 UTC) em uma string que representa o carimbo de data / hora daquele momento no fuso horário do sistema atual no formato "1970-01-01 00:00: 00 "
corda to_date (string timestamp) Ele retorna a parte da data de uma string de carimbo de data / hora: to_date ("1970-01-01 00:00:00") = "1970-01-01"
int ano (string data) Ele retorna a parte do ano de uma data ou uma string de carimbo de data / hora: ano ("1970-01-01 00:00:00") = 1970, ano ("1970-01-01") = 1970
int mês (string data) Ele retorna a parte do mês de uma data ou uma string de carimbo de data / hora: mês ("1970-11-01 00:00:00") = 11, mês ("1970-11-01") = 11
int dia (string data) Ele retorna a parte do dia de uma data ou string de carimbo de data / hora: day ("1970-11-01 00:00:00") = 1, day ("1970-11-01") = 1
corda get_json_object (string json_string, caminho da string) Ele extrai o objeto json de uma string json com base no caminho json especificado e retorna a string json do objeto json extraído. Ele retorna NULL se a string json de entrada for inválida.

Exemplo

As seguintes consultas demonstram algumas funções integradas:

função round ()

hive> SELECT round(2.6) from temp;

Na execução bem-sucedida da consulta, você verá a seguinte resposta:

3.0

função floor ()

hive> SELECT floor(2.6) from temp;

Na execução bem-sucedida da consulta, você verá a seguinte resposta:

2.0

função ceil ()

hive> SELECT ceil(2.6) from temp;

Na execução bem-sucedida da consulta, você verá a seguinte resposta:

3.0

Funções de agregação

O Hive é compatível com o seguinte aggregate functions. O uso dessas funções é igual ao das funções de agregação SQL.

Tipo de Devolução Assinatura Descrição
BIGINT contagem (*), contagem (expr), count (*) - Retorna o número total de linhas recuperadas.
EM DOBRO soma (col), soma (DISTINCT col) Ele retorna a soma dos elementos do grupo ou a soma dos valores distintos da coluna do grupo.
EM DOBRO média (col), média (DISTINCT col) Ele retorna a média dos elementos no grupo ou a média dos valores distintos da coluna no grupo.
EM DOBRO min (col) Ele retorna o valor mínimo da coluna no grupo.
EM DOBRO max (col) Ele retorna o valor máximo da coluna no grupo.