Apache Pig - GetYear ()

Esta função aceita um objeto de data e hora como parâmetro e retorna o ano atual do objeto de data e hora fornecido.

Sintaxe

Aqui está a sintaxe do GetYear() função.

grunt> GetYear(datetime)

Exemplo

Suponha que haja um arquivo chamado date.txt no HDFS diretório /pig_data/como mostrado abaixo. Este arquivo contém os detalhes da data de nascimento de uma pessoa em particular, tem id da pessoa, data e hora.

date.txt

001,1989/09/26 09:00:00
002,1980/06/20 10:22:00
003,1990/12/19 03:11:44

E, carregamos este arquivo no Pig com uma relação chamada date_data como mostrado abaixo.

grunt> date_data = LOAD 'hdfs://localhost:9000/pig_data/date.txt' USING PigStorage(',')
   as (id:int,date:chararray);

A seguir está um exemplo do GetYear()função. Ele recuperará o ano atual do objeto de data e hora fornecido. Portanto, em primeiro lugar, vamos gerar os objetos de data e hora de todos os funcionários usandotodate() função conforme mostrado abaixo.

grunt> todate_data = foreach date_data generate ToDate(date,'yyyy/MM/dd HH:mm:ss')
   as (date_time:DateTime );
  
grunt> Dump todate_data;
(1989-09-26T09:00:00.000+05:30) 
(1980-06-20T10:22:00.000+05:30) 
(1990-12-19T03:11:44.000+05:30)

Vamos agora obter o ano a partir da data de nascimento de cada funcionário usando o GetYear() função e armazena-o na relação nomeada getyear_data.

grunt> getyear_data = foreach todate_data generate (date_time), GetYear(date_time);

Agora verifique o conteúdo da relação getyear_data usando o operador Dump como mostrado abaixo.

grunt> Dump getyear_data;
  
(1989-09-26T09:00:00.000+05:30,1989) 
(1980-06-20T10:22:00.000+05:30,1980) 
(1990-12-19T03:11:44.000+05:30,1990)