SAP BODS - transformação de consulta

Esta é a transformação mais comum usada no Data Services e você pode executar as seguintes funções -

  • Filtragem de dados de fontes
  • Junção de dados de várias fontes
  • Execute funções e transformações em dados
  • Mapeamento de coluna dos esquemas de entrada para saída
  • Atribuição de chaves primárias
  • Adicionar novas colunas, esquemas e funções resultantes aos esquemas de saída

Como a transformação de consulta é a transformação mais comumente usada, um atalho é fornecido para esta consulta na paleta de ferramentas.

Para adicionar a transformação de consulta, siga as etapas fornecidas abaixo -

Step 1- Clique na paleta de ferramentas de transformação de consulta. Clique em qualquer lugar na área de trabalho Fluxo de dados. Conecte-o às entradas e saídas.

Quando você clica duas vezes no ícone de transformação Consulta, ele abre um editor de Consulta que é usado para executar operações de consulta.

As seguintes áreas estão presentes na transformação de consulta -

  • Esquema de entrada
  • Esquema de Saída
  • Parameters

Os esquemas de entrada e saída contêm colunas, esquemas aninhados e funções. Schema In e Schema Out mostra o esquema atualmente selecionado na transformação.

Para alterar o esquema de saída, selecione o esquema na lista, clique com o botão direito e selecione Tornar Atual.

Transformação de qualidade de dados

As transformações do Data Quality não podem ser conectadas diretamente à transformação upstream, que contém tabelas aninhadas. Para conectar essas transformações, você deve adicionar uma transformação de consulta ou transformação de pipeline XML entre a transformação da tabela aninhada e a transformação de qualidade de dados.

Como usar a transformação da qualidade de dados?

Step 1 - Vá para Biblioteca de Objetos → guia Transformar

Step 2 - Expanda a transformação Data Quality e adicione a transformação ou configuração de transformação que deseja adicionar ao fluxo de dados.

Step 3- Desenhe as conexões de fluxo de dados. Clique duas vezes no nome da transformação para abrir o editor de transformação. No esquema de entrada, selecione os campos de entrada que você deseja mapear.

Note - Para usar a transformação Associate, você pode adicionar campos definidos pelo usuário à guia de entrada.

Transformação de processamento de dados de texto

A Transformação de processamento de dados de texto permite que você extraia informações específicas de um grande volume de texto. Você pode pesquisar fatos e entidades, como clientes, produtos e fatos financeiros, específicos de uma organização.

Essa transformação também verifica o relacionamento entre entidades e permite a extração. Os dados extraídos, usando processamento de dados de texto, podem ser usados ​​em Business Intelligence, Reporting, query e analytics.

Transformação de Extração de Entidade

Em Data Services, o processamento de dados de texto é feito com a ajuda da Extração de Entidades, que extrai entidades e fatos de dados não estruturados.

Isso envolve a análise e processamento de grande volume de dados de texto, pesquisa de entidades, atribuindo-as ao tipo apropriado e apresentando metadados em formato padrão.

A transformação Extração de entidade pode extrair informações de qualquer conteúdo de texto, HTML, XML ou determinado formato binário (como PDF) e gerar saída estruturada. Você pode usar a saída de várias maneiras com base em seu fluxo de trabalho. Você pode usá-lo como uma entrada para outra transformação ou gravar em várias fontes de saída, como uma tabela de banco de dados ou um arquivo simples. A saída é gerada na codificação UTF-16.

Entity Extract Transform can be used in the following scenarios −

  • Encontrar uma informação específica de grande volume de texto.

  • Encontrar informações estruturadas de texto não estruturado com informações existentes para fazer novas conexões.

  • Relatórios e análises de qualidade do produto.

Diferenças entre TDP e limpeza de dados

O processamento de dados de texto é usado para localizar informações relevantes de dados de texto não estruturados. No entanto, a limpeza de dados é usada para padronização e limpeza de dados estruturados.

Parâmetros Processamento de Dados de Texto Limpeza de dados
Tipo de entrada Dados Não Estruturados Dados Estruturados
Tamanho de entrada Mais de 5 KB Menos de 5 KB
Escopo de entrada Domínio amplo com muitas variações Variações limitadas
Uso potencial Possíveis informações significativas de dados não estruturados Qualidade dos dados para armazenamento no Repositório
Resultado Crie anotações na forma de entidades, tipo, etc. A entrada não é alterada Crie campos padronizados, a entrada é alterada