Apache Pig - funções de avaliação

Apache Pig fornece várias funções integradas, nomeadamente eval, load, store, math, string, bag e tuple funções.

Funções de avaliação

Dada abaixo está a lista de eval funções fornecidas pelo Apache Pig.

SN Descrição da função
1 AVG ()

Para calcular a média dos valores numéricos dentro de uma bolsa.

2 BagToString ()

Para concatenar os elementos de uma bolsa em uma string. Ao concatenar, podemos colocar um delimitador entre esses valores (opcional).

3 CONCAT ()

Para concatenar duas ou mais expressões do mesmo tipo.

4 CONTAGEM()

Para obter o número de elementos em uma bolsa, enquanto conta o número de tuplas em uma bolsa.

5 COUNT_STAR ()

É semelhante ao COUNT()função. É usado para obter o número de elementos em uma bolsa.

6 DIFF ()

Para comparar dois sacos (campos) em uma tupla.

7 Está vazia()

Para verificar se uma bolsa ou mapa está vazio.

8 MAX ()

Para calcular o valor mais alto para uma coluna (valores numéricos ou chararrays) em um pacote de coluna única.

9 MIN ()

Para obter o valor mínimo (mais baixo) (numérico ou chararray) para uma determinada coluna em um pacote de coluna única.

10 PluckTuple ()

Usando o Pig Latin PluckTuple() função, podemos definir um prefixo de string e filtrar as colunas em uma relação que começa com o prefixo dado.

11 TAMANHO()

Para calcular o número de elementos com base em qualquer tipo de dados Pig.

12 SUBTRAIR()

Para subtrair dois sacos. Ele pega duas bolsas como entradas e retorna uma bolsa que contém as tuplas da primeira bolsa que não estão na segunda bolsa.

13 SOMA()

Para obter o total dos valores numéricos de uma coluna em um saco de coluna única.

14 TOKENIZE ()

Para dividir uma string (que contém um grupo de palavras) em uma única tupla e retornar uma bolsa que contém a saída da operação de divisão.