Apache Pig - TOBAG ()
o TOBAG()função do Pig Latin converte uma ou mais expressões em tuplas individuais. E essas tuplas são colocadas em uma bolsa.
Sintaxe
Dada a seguir está a sintaxe do TOBAG() função.
TOBAG(expression [, expression ...])
Exemplo
Suponha que temos um arquivo chamado employee_details.txt no diretório HDFS /pig_data/, com o seguinte conteúdo.
employee_details.txt
001,Robin,22,newyork
002,BOB,23,Kolkata
003,Maya,23,Tokyo
004,Sara,25,London
005,David,23,Bhuwaneshwar
006,Maggy,22,Chennai
Carregamos este arquivo no Pig com o nome da relação emp_data como mostrado abaixo.
grunt> emp_data = LOAD 'hdfs://localhost:9000/pig_data/employee_details.txt' USING PigStorage(',')
as (id:int, name:chararray, age:int, city:chararray);
Vamos agora converter o id, nome, idade e cidade de cada funcionário (registro) em uma tupla, conforme mostrado abaixo.
tobag = FOREACH emp_data GENERATE TOBAG (id,name,age,city);
Verificação
Você pode verificar o conteúdo do tobag relação usando o Dump operador como mostrado abaixo.
grunt> DUMP tobag;
({(1),(Robin),(22),(newyork)})
({(2),(BOB),(23),(Kolkata)})
({(3),(Maya),(23),(Tokyo)})
({(4),(Sara),(25),(London)})
({(5),(David),(23),(Bhuwaneshwar)})
({(6),(Maggy),(22),(Chennai)})