Apache Pig - RANDOM ()

o RANDOM() função é usada para obter um número pseudoaleatório (tipo duplo) maior ou igual a 0,0 e menor que 1,0.

grunt> RANDOM()

Exemplo

Suponha que haja um arquivo chamado math.txt no HDFS diretório /pig_data/. Este arquivo contém valores inteiros e de ponto flutuante conforme mostrado abaixo.

math.txt

5 
16 
9 
2.5 
5.9 
3.1

E, carregamos este arquivo no Pig com uma relação chamada math_data como mostrado abaixo.

grunt> math_data = LOAD 'hdfs://localhost:9000/pig_data/math.txt' USING PigStorage(',')
   as (data:float);

Vamos agora gerar valores aleatórios do conteúdo do arquivo math.txt usando RANDOM() função conforme mostrado abaixo.

grunt> random_data = foreach math_data generate (data), RANDOM();

A instrução acima armazena o resultado na relação chamada random_data. Verifique o conteúdo da relação usando o operador Dump conforme mostrado abaixo.

grunt> Dump random_data;
  
(5.0,0.6842057767279982) 
(16.0,0.9725172591786139) 
(9.0,0.4159326414649489) 
(2.5,0.30962777780713147) 
(5.9,0.705213727551145) 
(3.1,0.24247708413861724)