Apache NiFi - categorização de processadores

Neste capítulo, discutiremos a categorização de processos no Apache NiFi.

Processadores de ingestão de dados

Os processadores da categoria Data Ingestion são usados ​​para ingerir dados no fluxo de dados NiFi. Esses são principalmente o ponto de partida de qualquer fluxo de dados no apache NiFi. Alguns dos processadores que pertencem a essas categorias são GetFile, GetHTTP, GetFTP, GetKAFKA, etc.

Processadores de roteamento e mediação

Os processadores de roteamento e mediação são usados ​​para rotear os arquivos de fluxo para diferentes processadores ou fluxos de dados de acordo com as informações nos atributos ou conteúdo desses arquivos de fluxo. Esses processadores também são responsáveis ​​por controlar os fluxos de dados NiFi. Alguns dos processadores que pertencem a esta categoria são RouteOnAttribute, RouteOnContent, ControlRate, RouteText, etc.

Processadores de acesso a banco de dados

Os processadores desta categoria Database Access são capazes de selecionar ou inserir dados ou executar e preparar outras instruções SQL do banco de dados. Esses processadores usam principalmente a configuração do controlador de pool de conexão de dados do Apache NiFi. Alguns dos processadores que pertencem a esta categoria são ExecuteSQL, PutSQL, PutDatabaseRecord, ListDatabaseTables, etc.

Processadores de extração de atributos

Os processadores de extração de atributos são responsáveis ​​por extrair, analisar e alterar o processamento de atributos do arquivo de fluxo no fluxo de dados NiFi. Alguns dos processadores que pertencem a esta categoria são UpdateAttribute, EvaluateJSONPath, ExtractText, AttributesToJSON, etc.

Processadores de interação do sistema

Os processadores de interação do sistema são usados ​​para executar processos ou comandos em qualquer sistema operacional. Esses processadores também executam scripts em muitos idiomas para interagir com uma variedade de sistemas. Alguns dos processadores que pertencem a esta categoria são ExecuteScript, ExecuteProcess, ExecuteGroovyScript, ExecuteStreamCommand, etc.

Processadores de transformação de dados

Os processadores que pertencem à Transformação de Dados são capazes de alterar o conteúdo dos arquivos de fluxo. Eles podem ser usados ​​para substituir totalmente os dados de um arquivo de fluxo normalmente usado quando um usuário precisa enviar arquivo de fluxo como um corpo HTTP para invocar o processador HTTP. Alguns dos processadores que pertencem a esta categoria são ReplaceText, JoltTransformJSON, etc.

Processadores de envio de dados

Processadores de envio de dados geralmente são o processador final em um fluxo de dados. Esses processadores são responsáveis ​​por armazenar ou enviar dados ao servidor de destino. Depois de armazenar ou enviar os dados com sucesso, esses processadores DROP o arquivo de fluxo com relacionamento de sucesso. Alguns dos processadores que pertencem a esta categoria são PutEmail, PutKafka, PutSFTP, PutFile, PutFTP, etc.

Processadores de divisão e agregação

Esses processadores são usados ​​para dividir e mesclar o conteúdo presente em um arquivo de fluxo. Alguns dos processadores que pertencem a esta categoria são SplitText, SplitJson, SplitXml, MergeContent, SplitContent, etc.

Processadores HTTP

Esses processadores lidam com as chamadas HTTP e HTTPS. Alguns dos processadores que pertencem a esta categoria são InvokeHTTP, PostHTTP, ListenHTTP, etc.

Processadores AWS

Os processadores AWS são responsáveis ​​pela interação com o sistema de serviços da Web da Amazon. Alguns dos processadores que pertencem a esta categoria são GetSQS, PutSNS, PutS3Object, FetchS3Object, etc.