Apache Pig - funções de avaliação
Apache Pig fornece várias funções integradas, nomeadamente eval, load, store, math, string, bag e tuple funções.
Funções de avaliação
Dada abaixo está a lista de eval funções fornecidas pelo Apache Pig.
| SN | Descrição da função |
|---|---|
| 1 | AVG ()
Para calcular a média dos valores numéricos dentro de uma bolsa. |
| 2 | BagToString ()
Para concatenar os elementos de uma bolsa em uma string. Ao concatenar, podemos colocar um delimitador entre esses valores (opcional). |
| 3 | CONCAT ()
Para concatenar duas ou mais expressões do mesmo tipo. |
| 4 | CONTAGEM()
Para obter o número de elementos em uma bolsa, enquanto conta o número de tuplas em uma bolsa. |
| 5 | COUNT_STAR ()
É semelhante ao COUNT()função. É usado para obter o número de elementos em uma bolsa. |
| 6 | DIFF ()
Para comparar dois sacos (campos) em uma tupla. |
| 7 | Está vazia()
Para verificar se uma bolsa ou mapa está vazio. |
| 8 | MAX ()
Para calcular o valor mais alto para uma coluna (valores numéricos ou chararrays) em um pacote de coluna única. |
| 9 | MIN ()
Para obter o valor mínimo (mais baixo) (numérico ou chararray) para uma determinada coluna em um pacote de coluna única. |
| 10 | PluckTuple ()
Usando o Pig Latin PluckTuple() função, podemos definir um prefixo de string e filtrar as colunas em uma relação que começa com o prefixo dado. |
| 11 | TAMANHO()
Para calcular o número de elementos com base em qualquer tipo de dados Pig. |
| 12 | SUBTRAIR()
Para subtrair dois sacos. Ele pega duas bolsas como entradas e retorna uma bolsa que contém as tuplas da primeira bolsa que não estão na segunda bolsa. |
| 13 | SOMA()
Para obter o total dos valores numéricos de uma coluna em um saco de coluna única. |
| 14 | TOKENIZE ()
Para dividir uma string (que contém um grupo de palavras) em uma única tupla e retornar uma bolsa que contém a saída da operação de divisão. |