Apache NiFi - processadores

Os processadores Apache NiFi são os blocos básicos para a criação de um fluxo de dados. Cada processador possui uma funcionalidade diferente, o que contribui para a criação do arquivo de fluxo de saída. O fluxo de dados mostrado na imagem abaixo busca o arquivo de um diretório usando o processador GetFile e o armazena em outro diretório usando o processador PutFile.

GetFile

O processo GetFile é usado para buscar arquivos de um formato específico de um diretório específico. Ele também fornece outras opções ao usuário para obter mais controle sobre a busca. Vamos discutir isso na seção de propriedades abaixo.

Configurações de GetFile

A seguir estão as diferentes configurações do processador GetFile -

Nome

Na configuração Nome, um usuário pode definir qualquer nome para os processadores de acordo com o projeto ou por ele, o que torna o nome mais significativo.

Habilitar

Um usuário pode habilitar ou desabilitar o processador usando esta configuração.

Duração da Penalidade

Esta configuração permite que um usuário adicione a duração do tempo de penalidade, no caso de falha do arquivo de fluxo.

Duração do rendimento

Esta configuração é usada para especificar o tempo de rendimento do processador. Nesse período, o processo não é agendado novamente.

Nível de Boletim

Esta configuração é usada para especificar o nível de log desse processador.

Encerrar Relacionamentos Automaticamente

Ele contém uma lista de verificação de todos os relacionamentos disponíveis desse processo específico. Ao marcar as caixas, um usuário pode programar o processador para encerrar o arquivo de fluxo naquele evento e não enviá-lo mais adiante no fluxo.

Agendamento GetFile

Estas são as seguintes opções de agendamento oferecidas pelo processador GetFile -

Estratégia de cronograma

Você pode agendar o processo com base no tempo, selecionando controlado pelo tempo, ou uma string CRON especificada, selecionando uma opção de driver CRON.

Tarefas Simultâneas

Esta opção é usada para definir a programação de tarefa simultânea para este processador.

Execução

Um usuário pode definir se deseja executar o processador em todos os nós ou apenas no nó Primário usando esta opção.

Executar cronograma

É usado para definir o tempo para a estratégia baseada no tempo ou a expressão CRON para a estratégia baseada no CRON.

Propriedades GetFile

GetFile oferece várias propriedades, conforme mostrado na imagem abaixo, variando entre propriedades obrigatórias, como diretório de entrada e filtro de arquivo, para propriedades opcionais, como Filtro de caminho e Tamanho máximo do arquivo. Um usuário pode gerenciar o processo de obtenção de arquivos usando essas propriedades.

Comentários GetFile

Esta seção é usada para especificar qualquer informação sobre o processador.

PutFile

O processador PutFile é usado para armazenar o arquivo do fluxo de dados em um local específico.

Configurações de PutFile

O processador PutFile tem as seguintes configurações -

Nome

Na configuração Nome, um usuário pode definir qualquer nome para os processadores de acordo com o projeto ou por aquilo que torna o nome mais significativo.

Habilitar

Um usuário pode habilitar ou desabilitar o processador usando esta configuração.

Duração da Penalidade

Esta configuração permite que um usuário adicione a duração do tempo de penalidade, no caso de falha do arquivo de fluxo.

Duração do rendimento

Esta configuração é usada para especificar o tempo de rendimento do processador. Nessa duração, o processo não é agendado novamente.

Nível de Boletim

Esta configuração é usada para especificar o nível de log desse processador.

Encerrar Relacionamentos Automaticamente

Esta configuração possui uma lista de verificação de todas as relações disponíveis daquele processo em particular. Ao marcar as caixas, o usuário pode programar o processador para encerrar o arquivo de fluxo naquele evento e não enviá-lo posteriormente no fluxo.

Agendamento de PutFile

Estas são as seguintes opções de agendamento oferecidas pelo processador PutFile -

Estratégia de cronograma

Você pode agendar o processo com base no tempo, selecionando acionado por cronômetro ou uma string CRON especificada, selecionando a opção de driver CRON. Existe também uma estratégia Experimental Event Driven, que acionará o processador em um evento específico.

Tarefas Simultâneas

Esta opção é usada para definir a programação de tarefa simultânea para este processador.

Execução

Um usuário pode definir se deseja executar o processador em todos os nós ou apenas no nó primário usando esta opção.

Executar cronograma

É usado para definir o tempo para estratégia orientada por cronômetro ou expressão CRON para estratégia orientada por CRON.

Propriedades PutFile

O processador PutFile fornece propriedades como Directory para especificar o diretório de saída para fins de transferência de arquivos e outros para gerenciar a transferência, conforme mostrado na imagem abaixo.

Comentários PutFile

Esta seção é usada para especificar qualquer informação sobre o processador.