Transformações da Informatica: o coração e a alma do Informatica PowerCenter



Obtenha um entendimento completo do que são Transformações da Informatica e uma visão geral das várias transformações principais da Informatica com casos de uso.

As Transformações da Informatica são objetos de repositório que podem ler, modificar ou passar dados para as estruturas de destino definidas, como tabelas, arquivos ou qualquer outro destino necessário. Uma transformação é basicamente usada para representar um conjunto de regras, que definem o fluxo de dados e como os dados são carregados nos destinos. O Informatica PowerCenter oferece várias transformações, cada uma atendendo a uma funcionalidade específica.Além disso, com a Informatica liderando o mercado de hoje em plataforma de integração de dados, Informatica Transformations surge como um conceito crucial necessário para .

Para entender melhor as Transformações da Informatica, vamos primeiro entender o que é mapeamento? Um mapeamento é uma coleção de objetos de origem e destino vinculados por um conjunto de transformações. Portanto, as transformações em um mapeamento representam as operações que o serviço de integração executará nos dados durante a execução do fluxo de trabalho. Para entender melhor o fluxo de trabalho, você pode verificar nosso blog Tutorial da Informatica: gerenciamento de fluxo de trabalho





O que são as várias transformações da Informatica?

As transformações da Informatica podem ser classificadas principalmente em duas categorias. Em primeiro lugar, com base na conectividade (vinculação no mapeamento) das transformações entre si e o segundo é baseado na mudança no número geral de linhas entre a origem e o destino. Vamos começar dando uma olhada nas transformações da Informatica com base na conectividade.

1) Tipos de transformações na Informatica com base na conectividade:



  • Transformações conectadas.
  • Transformações não conectadas.

Na Informatica, as transformações que estão conectadas a uma ou mais transformações são chamadas de Transformações conectadas .

As transformações conectadas são usadas quando, para cada linha de entrada, uma transformação é chamada e deve retornar um valor. Por exemplo, podemos usar uma transformação de pesquisa conectada para saber os nomes de todos os funcionários que trabalham em um departamento específico, especificando o ID do departamento na expressão de pesquisa.

Algumas das principais transformações da Informatica conectadas são Aggregator, Router, Joiner, Normalizer, etc.



Essas transformações que não estão conectadas a nenhuma outra transformação são chamadas Transformações não conectadas .Sua funcionalidade é usada chamando-os dentro de outras transformações, como a transformação de Expressão. Essas transformações não fazem parte do pipeline de mapeamento.

As transformações não conectadas são usadas quando sua funcionalidade só é exigida com base em certas condições.Por exemplo, como um programador, você deseja realizar uma operação complicada nos dados, no entantovocê não deseja usar transformações Informatica como transformações de expressão ou filtro para executar esta operação. Nesse caso, você pode criar uma DLL externa ou biblioteca compartilhada UNIX com os códigos para realizar a operação e chamá-los na transformação de procedimento externo.

Existem 3 transformações da Informatica viz. Procedimento externo, pesquisa e procedimento armazenado que podem ser desconectados em um mapeamento válido (um mapeamento que o Serviço de Integração pode executar).

2) Tipos de transformações da Informatica com base na alteração no número de linhas

  • Transformações Ativas
  • Transformações Passivas

Transformações Ativas :- Uma transformação ativa pode realizar qualquer uma das seguintes ações:

  • Altere o número de linhas que passam pela transformação: por exemplo, a transformação de Filtro está ativa porque remove linhas que não atendem à condição de filtro.
  • Mude o limite da transação: Um limite da transação é aquele que envolve todas as transações antes que uma confirmação seja chamada ou entre duas chamadas de confirmação. Por exemplo, durante uma operação transacional, o usuário sente que, após certas transações, um commit é necessário e chama o comando commit para criar um ponto de salvamento e, ao fazer isso, o usuário altera o limite de transação padrão. Por padrão, o limite da transação fica entre o início do arquivo para o ponto de confirmação automática ou EOF.
  • Altere o atributo rowtype: o atributo Rowtype é um tipo de registro que representa uma linha em uma tabela. O registro pode armazenar uma linha inteira de dados selecionados da tabela ou buscar de um ponteiro ou variável de ponteiro. Por exemplo, a transformação de Estratégia de Atualização sinaliza o tipo de linha como 0 para inserir valores, 1 para atualização, 2 para exclusão ou 3 para rejeição.
  • Agregador, Filtro, Joiner, Normalizador, etc. são alguns exemplos de transformação Ativa.

Transformação Passiva : Uma transformação passiva é aquela que irá satisfazer todas estas condições:

  • O número de linhas antes e depois da transformação é o mesmo.
  • Mantém o limite da transação.
  • Mantém o atributo rowtype.
  • Expression, ExternalProcedure, HTTP, etc. são alguns exemplos de transformação passiva.

Na transformação passiva, nenhuma nova linha é criada ou as linhas existentes são eliminadas.

Você deve estar se perguntando por que as transformações passivas são usadas se não alteram o número de linhas. Eles geralmente são usados ​​para atualizar valores, chamando um procedimento externo de uma biblioteca compartilhada e para definir a entrada e a saída de maplets. Um maplet é uma coleção apenas das transformações do mapeamento. Por exemplo, para um banco de dados de aluno, desejamos atualizar os valores da coluna de marcas para percentil em vez de porcentagem, isso pode ser feito usando uma transformação de expressão que irá converter os valores e atualizar nas mesmas colunas mantendo o mesmo número total de linhas após as transformações.

Não há restrição de que, se uma transformação estiver sendo usada como uma transformação passiva, ela não poderá ser usada posteriormente como uma transformação ativa. Da mesma forma, uma transformação não conectada pode ser usada como uma transformação conectada de acordo com as necessidades. Todas as combinações possíveis podem ser formadas entre essas categorias e essa é a mágica das transformações da Informatica. Você terá uma ideia melhor posteriormente neste blog sobre os possíveis tipos aos quais uma transformação pode pertencer.

Agora que entendemos os vários tipos de transformações da Informatica, vamos começar a explorá-los.Abaixo estão alguns tipos principais de transformações da Informatica:

Transformação Tipo Descrição
AgregadorAtivo conectadoExecuta cálculos agregados.
ExpressãoPassivo conectadoCalcula um valor.
JavaAtivo conectado ou passivo conectadoExecuta a lógica do usuário codificada em Java. O bytecode para a lógica do usuário é armazenado no repositório
MarceneiroAtivo conectadoUne dados de diferentes bancos de dados ou sistemas de arquivos simples.
Olho para cimaAtivo conectado ou passivo conectado ou ativo não conectado ou passivo desconectadoConsulte e retorne dados de um arquivo simples, tabela relacional, visão ou sinônimo.
NormalizadorAtivo conectadoUsado no pipeline para normalizar dados de fontes relacionais ou de arquivo simples.
ClassificaçãoAtivo conectadoLimita os registros a uma faixa superior ou inferior.
RoteadorAtivo conectadoRoteia dados em várias transformações com base nas condições do grupo.
SQLAtivo conectado ou passivo conectadoExecuta consultas SQL em um banco de dados.
UniãoAtivo conectadoMescla dados de diferentes bancos de dados ou sistemas de arquivos simples.
Gerador XMLAtivo conectadoLê dados de uma ou mais portas de entrada e gera XML por meio de uma única porta de saída.
Analisador de XMLAtivo conectadoLê XML de uma porta de entrada e dados de saída para uma ou mais portas de saída.
Qualificador de origem XMLAtivo conectadoRepresenta as linhas que o Serviço de Integração lê de uma fonte XML ao executar uma sessão.

Vamos agora começar a olhar as transformações uma a uma.

Transformação de agregador

A transformação de agregador é uma transformação Ativa e Conectada. Essa transformação da Informatica é útil para realizar cálculos como médias e somas (principalmente para realizar cálculos em várias linhas ou grupos). Por exemplo, para calcular o número total de vendas diárias ou para calcular a média das vendas mensais ou anuais. Funções agregadas, como AVG, FIRST, COUNT, PERCENTILE, MAX, SUM, etc., podem ser usadas na transformação agregada.

Transformação de pesquisa

A transformação de pesquisa é a transformação da Informatica mais popular e amplamente usada. Com base no requisito do usuário, a transformação de pesquisa pode ser usada como uma transformação Conectada ou Desconectada combinando-a como uma transformação Ativa ou Passiva. Eut é usado principalmente para consultar os detalhes de uma origem, qualificador de origem ou destino para obter os dados necessários relevantes. Você também pode procurar um 'arquivo simples', 'tabela relacional', 'visualização' ou 'sinônimo'. Pode-se usar várias transformações de pesquisa em um mapeamento.

A transformação de pesquisa é criada com o seguinte tipo de portas (pontos lógicos para transferência de informações):

  • Porta de entrada (I)
  • Porta de saída (O)
  • Pesquisar portas (L)
  • Porta de retorno (R) (somente no caso de pesquisa desconectada)

Diferenças entre a transformação de pesquisa conectada e não conectada:

perguntas da entrevista c ++ stl
  • A pesquisa conectada recebe valores de entrada diretamente do pipeline de mapeamento, enquanto a pesquisa UnConnected recebe valores da pesquisa expressão de outra transformação. Um mapeamento na Informatica pode conter Origem, Transformações e Destinos conectados juntos são considerados um pipeline.
  • A pesquisa conectada retorna várias colunas da mesma linha, pois elas têm várias portas de retorno, ondesA pesquisa não conectada tem apenas uma porta de retorno e retorna uma coluna de cada linha. Por exemplo, se usarmos uma pesquisa conectada em um banco de dados de funcionários para um ID de departamento específico como um parâmetro, podemos obter todos os detalhes relacionados aos funcionários desse departamento, como seus nomes, número de ID do funcionário, endereço, etc., enquanto com em uma pesquisa desconectada, podemos obter apenas um atributo do funcionário, como seu nome ou número de identificação do funcionário ou qualquer atributo especificado pelo usuário.
  • A pesquisa conectada armazena em cache todas as colunas de pesquisa, enquanto a pesquisa não conectada armazena em cache apenas a saída da pesquisa e as condições de pesquisa.
  • A pesquisa conectada oferece suporte a valores padrão definidos pelo usuário, enquanto a pesquisa não conectada não oferece suporte a valores definidos pelo usuário. Por exemplo, se você deseja alterar todos os valores de uma determinada coluna para NULL após a pesquisa, você pode definir o valor padrão dessas colunas como NULL nas expressões de pesquisa. No entanto, este recurso não é possível no caso de pesquisa Desconectada.

Digamos que, a partir de um banco de dados de clientes, eu gostaria de saber os detalhes dos clientes que têm mais de 1 fatura não cancelada. Para obter esses dados, podemos usar uma transformação de pesquisa.

Aqui estão as etapas.

  1. Comece carregando a tabela de fatura como a origem no designer de mapeamento. Caso você não saiba como carregar os dados de origem no Designer, Clique aqui . lookup-source-informatica transformations-edureka
  2. Vamos agora filtrar as Faturas que não foram canceladas. Para fazer isso, crie um novo filtro chamado fil_ODS_CUSTOMER_ACTIVE para o qualificador de origem com a propriedade NÃO (ISNULL (DATE_CLOSED)) E CANCELADO = 0.
  3. Agora adicione uma transformação de pesquisa no designer, conforme visto abaixo com o nome lkp_CUSTOMER :

  4. Especifique a tabela de pesquisa como a tabela do cliente.
  5. Clique duas vezes no cabeçalho de lkp_CUSTOMER para abrir o menu de edição. Na guia Condição, defina a condição de pesquisa como CUST_ID = CUST_NO.
  6. Na guia Propriedades, altere as Informações de Conexão para $ Source e clique em Está bem para salvar a transformação:
  7. Ligue o lkp_CUSTOMER portas para ODS_CUSTOMER_ACTIVE portas para completar a transformação necessária onde ODS_CUSTOMER_ACTIVE é o arquivo de destino necessário:
  8. O mapa icônico final, incluindo a transformação de pesquisa, deve ser como abaixo:

Transformação de Expressão

A transformação de expressão é uma transformação Passiva e Conectada da Informatica. As transformações de expressão são usadas para manipulação de linha. Para qualquer tipo de manipulação que você deseja realizar em um registro individual, use uma transformação de Expressão. A transformação Expressão aceita os dados de linha, os manipula e os passa para o destino. Por exemplo, para calcular o desconto para cada produto ou para concatenar nomes e sobrenomes ou para converter datas em um campo de string.

Transformação de Joiner

A transformação de Joiner é uma transformação Active and Connected Informatica usada para unir duas fontes heterogêneas. A transformação de junção une fontes com base em uma condição especificada que corresponde a um ou mais pares de colunas entre as duas fontes. Os dois pipelines de entrada incluem um mestre e um pipeline ou ramificação de detalhes. Para unir mais de duas origens, você precisa unir a saída da transformação do joiner com outra origem. Para unir n número de origens em um mapeamento, você precisa de n-1 transformações de joiner. A transformação de Joiner oferece suporte aos seguintes tipos de junções:
  • Normal
  • Mestre Exterior
  • Detalhe Externo
  • Exterior Completo
Normal join descarta todas as linhas de dados da fonte mestre e de detalhes que não correspondem, com base na condição. Mestre exterior joins descarta todas as linhas sem correspondência da fonte mestre e mantém todas as linhas da fonte de detalhes e as linhas correspondentes da fonte mestre. Detalhe fora r join mantém todas as linhas de dados da fonte mestre e as linhas correspondentes da fonte de detalhes. Ele descarta as linhas sem correspondência da fonte de detalhes. Exterior completo join mantém todas as linhas de dados das fontes mestre e de detalhes.

Não podemos juntar mais de duas fontes usando um único joiner. Para unir três fontes, precisamos ter duas transformações de joiner.

Digamos que queremos juntar três tabelas - Funcionários, Departamentos e Locais - usando o Joiner. Precisaremos de dois marceneiros. Joiner-1 irá ingressar, Employees and Departments e Joiner-2 irá ingressar, a saída da tabela Joiner-1 e Locais.

Aqui estão as etapas:

  1. Traga três fontes para o designer de mapeamento.
  2. Crie o Joiner -1 para unir Funcionários e Departamentos usando Department_ID.

  3. Crie o próximo joiner, Joiner-2. Pegue a saída do Joiner-1 e as portas da Tabela de locais e traga-os para o Joiner-2. Junte essas duas fontes de dados usando Location_ID.
  4. A última etapa é enviar o necessárioportosdo Joiner-2 para o destino ou por meio de uma expressãotransformaçãopara a tabela de destino.

Transformação Sindical

A Transformação de União é uma transformação ativa e conectada da Informatica. Ele é usado para mesclar vários conjuntos de dados de vários fluxos ou pipelines em um conjunto de dados. Essa transformação da Informatica funciona de maneira semelhante ao comando UNION ALL no SQL, mas não remove nenhuma linha duplicada. Recomenda-se usar um agregador para remover duplicatas que não são esperadas no destino.

Transformação do normalizador

Normalizador Transformação é uma transformação ativa e conectada da Informatica. É uma das transformações da Informatica mais amplamente usadas, principalmente com origens COBOL, nas quais a maior parte do tempo os dados são armazenados em formato desnormalizado. Além disso, a transformação do Normalizador pode ser usada para criar várias linhas de uma única linha de dados.

Vamos tentar carregar um arquivo simples de dados separados por vírgula de um arquivo simples / fonte Cobol.

Aqui estão as etapas:

  1. Comece carregando a Loja (arquivo simples) com o nome da loja e a receita trimestral:
  2. Crie uma nova transformação de Normalizador chamada NRM_STORE_EXP com duas portas Store e Quarter (repete-se 4 vezes porque temos dados para 4 trimestres) como visto abaixo:
  3. A guia de portas deve ser como visto abaixo:
  4. Copie / vincule as seguintes colunas e conecte à Transformação do Normalizador.
    Loja
    Trimestre 1
    2º Trimestre
    3º Trimestre
    Quarto trimestre
    O mapeamento deve ser o seguinte:
  5. Crie uma nova Expressão Transformação com exp_STORE . Copie / vincule as seguintes colunas e conecte à Transformação de Expressão, conforme mostrado abaixo:
    Loja
    Trimestre
    GK_QUARTER
    GCID_QUARTER
  6. Vincule a expressão ao destino final para concluir o mapeamento usando a transformação de Normalização.

Transformação XML

As transformações XML são transformações Active and Connected Informatica. Nas transformações da Informatica, a transformação XML é usada principalmente quando o arquivo de origem é do tipo XML ou os dados são do tipo XML. A transformação XML pode ser classificada principalmente em 3 transformações:

  • Transformação do qualificador de origem XML.
  • Transformação do analisador XML.
  • Transformação do gerador de XML.

Qualificador de origem XML Transformação : O Qualificador de Origem XML é uma transformação Ativa e Conectada. O Qualificador de origem XML é usado apenas com uma definição de origem XML. Ele representa os elementos de dados que o Informatica Server lê ao executar uma sessão com origens XML. O Qualificador de Origem XML tem uma porta de entrada ou saída para cada coluna na origem. Se você remover uma definição de origem XML de um mapeamento, o Designer também removerá a transformação de Qualificador de Origem XML correspondente.

Transformação do analisador XML: A transformação do analisador XML é uma transformação ativa e conectada. A transformação XML Parser é usada para extrair XML dentro de um pipeline e, em seguida, passá-lo para o destino. O XML é extraído dos sistemas de origem, como arquivos ou bancos de dados. A transformação XML Parser lê dados XML de uma única porta de entrada e grava dados em uma ou mais portas de saída.

Transformação do gerador XML: O XML Generator é uma transformação ativa e conectada. A transformação XML Generator é usada para criar XML dentro de um pipeline. A transformação do XML Generator lê dados de uma ou mais portas de entrada e gera XML por meio de uma única porta de saída.

Transformação de classificação

A transformação de classificação é uma transformação ativa e conectada. É uma transformação da Informatica que ajuda você a selecionar a classificação superior ou inferior dos dados. Por exemplo, para selecionar as 10 principais regiões onde o volume de vendas era muito alto ou para selecionar os 10 produtos com preços mais baixos.

Considere que você deseja carregar o primeiro e o último registro em uma tabela de destino de meu banco de dados de funcionários. A ideia por trás disso é adicionar um número de sequência aos registros e, em seguida, obter a classificação 1 superior e 1 classificação inferior dos registros.

  1. Arraste e solte portas do qualificador de origem para duas transformações de classificação.
  2. Crie um gerador de sequência reutilizável tendo o valor inicial 1 e conecte o próximo valor a ambas as transformações de classificação.
  3. Defina as propriedades de classificação da seguinte maneira. A porta de sequência recém-adicionada deve ser escolhida como Porta de classificação. Não há necessidade de selecionar qualquer porta como Grupo por Porta.Rank - 1
  4. Classificação - 2
  5. Faça duas instâncias do alvo.Conecte a porta de saída ao destino.

Transformação de roteador

O roteador é uma transformação ativa e conectada. É semelhante à transformação do filtro. A única diferença é que a transformação do filtro descarta os dados que não atendem à condição, enquanto o roteador tem a opção de capturar os dados que não atendem à condição. É útil testar várias condições. Possui grupos de entrada, saída e padrão.

Digamos que você deseja separar os registros pares e ímpares de uma tabela, isso pode ser feito usando uma transformação de roteador.

A ideia é adicionar um número de sequência aos registros e depois dividir o número do registro por 2. Se for divisível, mova-o para o alvo par e, se não, mova-o para o alvo ímpar.

  1. Arraste a origem e conecte-se a uma transformação de expressão.
  2. Adicione o próximo valor de um gerador de sequência à transformação da expressão.
  3. Na transformação da expressão, faça duas portas, uma é “ímpar” e outra “par”.
  4. Escreva a expressão como abaixo
  5. Conecte uma transformação de roteador à expressão.
  6. Faça dois grupos sob a transformação do roteador.
  7. Dê a condição conforme abaixo
  8. Em seguida, envie os dois grupos para alvos diferentes. Esse é todo o fluxo.

Espero que este blog da Transformação da Informatica tenha sido útil para aumentar sua compreensão sobre as várias transformações da Informatica e tenha gerado interesse suficiente para aprender mais sobre a Informatica.

Se você achou este blog útil, também pode conferir nossa série de blogs Tutorial da Informatica e Tutorial da Informatica: Compreendendo a Informatica de 'dentro para fora' .Caso esteja procurando detalhes sobre a Certificação Informatica, você pode conferir nosso blog Certificação Informatica: Tudo o que há para saber .

maneiras de criar uma classe singleton em java

Se você já decidiu seguir carreira na Informatica, eu recomendo porque não dá uma olhada em nosso página do curso. O treinamento de certificação da Informatica na Edureka tornará você um especialista em Informatica por meio de sessões ao vivo com instrutor e treinamento prático usando casos de uso da vida real.