Por que você deve combinar quando já pode ingressar no Tableau?



Combinação de dados no Tableau - um método usado quando há dados relacionados em várias fontes de dados, que você deseja analisar juntos em uma única exibição.

Em um mundo que gera e consome 2,5 quintilhões de bytes de dados, por dia, as organizações estão fadadas a buscar novos métodos para transformar e combinar dados a fim de atingir a eficiência ideal. Um desses métodos de combinação de dados é Combinação de dados no Tableau .

Agora, porque isso serve a um propósito tão importante no ciclo de dados de qualquer organização, torna-se um módulo muito essencial na maioria . Neste blog, discutiremos os seguintes conceitos:





Por que você precisa da combinação de dados no Tableau?

Suponha que você é um Mesa do desenvolvedor quem tem dados transacionais armazenados no Salesforce e dados de cota armazenados no Access. Os dados que você deseja combinar são armazenados em bancos de dados diferentes e a granularidade dos dados capturados em cada tabela é diferente nas duas fontes de dados, portanto, a combinação de dados é a melhor maneira de combinar esses dados.

A combinação de dados é útil nas seguintes condições:



  1. Você deseja combinar dados de bancos de dados diferentes que não são suportados por associações de banco de dados cruzado.

    As junções de banco de dados cruzado não oferecem suporte a conexões com cubos (por exemplo, Oracle Essbase) ou para algumas conexões somente de extração (por exemplo, Google Analytics). Nesse caso, configure fontes de dados individuais para os dados que deseja analisar e, em seguida, use a combinação de dados para combinar as fontes de dados em uma única planilha.

    o que é um leitor de buffer
  2. Os dados estão em diferentes níveis de detalhe.

    Às vezes, um conjunto de dados captura dados usando vários níveis de detalhe ou seja, maior ou menor granularidade do que o outro conjunto de dados.

    Por exemplo, suponha que você esteja analisando dados transacionais e dados de cota. Os dados transacionais podem capturar todas as transações. No entanto, os dados de cota podem agregar transações no nível do trimestre. Como os valores transacionais são capturados em diferentes níveis de detalhe em cada conjunto de dados, você deve usar a combinação de dados para combinar os dados.



O que é combinação de dados no Tableau?

A combinação de dados é um recurso muito poderoso no Borda . É usado quando há dados relacionados em várias fontes de dados, que você deseja analisar juntos em uma única exibição. É um método para combinar dados que complementa uma tabela de dados de uma fonte de dados com colunas de dados de outra fonte de dados.

Normalmente, você usa junções para realizar esse tipo de combinação de dados, mas às vezes, dependendo de fatores como o tipo de dados e sua granularidade, é melhor usar a combinação de dados.

Como é diferente da junção de dados?

A combinação de dados simula uma junção à esquerda tradicional. A principal diferença entre os dois é quando a junção é executada em relação à agregação.

Associação à esquerda

Quando você usa uma junção à esquerda para combinar dados, uma consulta é enviada ao banco de dados onde a junção é realizada. Usar uma junção à esquerda retorna todas as linhas da tabela à esquerda e quaisquer linhas da tabela à direita que tenham uma correspondência de linha correspondente na tabela à esquerda. Os resultados da associação são então enviados de volta e agregados pelo Tableau.

Por exemplo, suponha que você tenha as tabelas a seguir. Se as colunas comuns são ID do usuário , uma junção à esquerda pega todos os dados da tabela da esquerda, bem como todos os dados da tabela da direita, porque cada linha tem uma correspondência de linha correspondente na tabela da esquerda.

Junção de dados - Combinação de dados no Tableau - EdurekaCombinação de dados

Quando você usa a combinação de dados para combinar dados, uma consulta é enviada ao banco de dados para cada fonte de dados usada na planilha. Os resultados das consultas, incluindo os dados agregados, são enviados de volta e combinados pelo Tableau. A exibição usa todas as linhas da fonte de dados primária, a tabela esquerda e as linhas agregadas da fonte de dados secundária, a tabela direita, com base na dimensão dos campos de vinculação.

Você pode alterar o campo de vinculação ou adicionar mais campos de vinculação para incluir linhas de dados diferentes ou adicionais da fonte de dados secundária na combinação, alterando os valores agregados.

Por exemplo, suponha que você tenha as tabelas a seguir. Se os campos de ligação forem ID do usuário em ambas as tabelas, a combinação de seus dados pega todos os dados da tabela da esquerda e complementa a tabela da esquerda com os dados da tabela da direita. Nesse caso, nem todos os valores podem fazer parte da tabela resultante devido ao seguinte:

  • Uma linha na tabela da esquerda não possui uma correspondência de linha correspondente na tabela da direita, conforme indicado pelo valor nulo.
  • Existem vários valores correspondentes nas linhas da tabela à direita, conforme indicado pelo asterisco (*).

Suponha que você tenha as mesmas tabelas acima, mas a fonte de dados secundária contém um novo campo chamado Objetivos . Novamente, se o campo de vinculação for ID do usuário , combinar seus dados pega todos os dados da tabela da esquerda e os complementa com os dados da tabela da direita. Nesse caso, você vê o mesmo valor nulo e asteriscos no exemplo anterior, além do seguinte:

  • Porque o Objetivos campo é uma medida, você vê os valores da linha para oObjetivoscampo agregado antes que os dados da tabela direita sejam combinados com os dados da tabela esquerda.
  • Como no exemplo anterior, uma linha na tabela à esquerda não tem a linha correspondente para o Objetivos campo, conforme indicado pelo segundo valor nulo.

Quando substituir a adesão por Misturando

1. Os dados precisam de limpeza.

Se suas tabelas não corresponderem entre si corretamente após uma junção, configure as fontes de dados para cada tabela, faça as personalizações necessárias (ou seja, renomeie as colunas, altere os tipos de dados das colunas, crie grupos, use cálculos, etc.) e em seguida, use a combinação de dados para combinar os dados.

2. Associações causam dados duplicados.

Dados duplicados após uma junção são um sintoma de dados em diferentes níveis de detalhe. Se você notar dados duplicados, em vez de criar uma junção, use a combinação de dados para combinar em uma dimensão comum.

3. Você tem muitos dados.

Normalmente, as junções são recomendadas para combinar dados do mesmo banco de dados. As junções são gerenciadas pelo banco de dados, o que permite que as junções aproveitem alguns dos recursos nativos do banco de dados. No entanto, se você estiver trabalhando com grandes conjuntos de dados, as junções podem sobrecarregar o banco de dados e afetar significativamente o desempenho. Nesse caso, a combinação de dados pode ajudar. Como o Tableau lida com a combinação dos dados depois que os dados são agregados, há menos dados para combinar. Quando há menos dados para combinar, geralmente, o desempenho melhora.

Combinando seus dados no Tableau

Você pode usar a combinação de dados quando tiver dados em fontes de dados separadas que deseja analisar juntos em uma única planilha. Tableau tem duas fontes de dados embutidas chamadas Superloja de amostra e Sample coffee chain.mdb que será usado para ilustrar a combinação de dados.

Etapa 1: conecte-se aos seus dados e configure as fontes de dados

  • Conecte-se a um conjunto de dados e configure a fonte de dados na página da fonte de dados. Um eufonte de dados nbuilt Sample coffee chain.mdb ,que é um arquivo de banco de dados do MS Access, será usado para ilustrar a combinação de dados.
  • Vamos para Dados > Nova fonte de dados, conecte-se ao segundo conjunto de dados.Este exemplo usa o Amostra - Superloja fonte de dados. Tuando configurar a fonte de dados.
  • Clique na guia da folha para começar a construir sua visualização.

Etapa 2: designar uma fonte de dados primária

  • Arraste pelo menos um campo de sua fonte de dados primária para a exibição para designá-lo como a fonte de dados primária. No Dados painel, clique na fonte de dados que deseja designar como a fonte de dados primária. Neste exemplo, Cadeia de café de amostra é selecionado.
  • A captura de tela a seguir mostra as diferentes tabelas e junções disponíveis no arquivo.

Etapa 3: designar uma fonte de dados secundária

como converter um duplo em um int em java
  • Os campos usados ​​na exibição de fontes de dados que não são a fonte de dados primária ou links ativos designam automaticamente as fontes de dados subsequentes como a fonte de dados secundária. Nesse caso, Sample Superstore.

Etapa 4: combinar dados

  • Agora você pode integrar os dados de ambas as fontes com base em uma dimensão comum ( Estado , nesse caso). Observe que uma pequena imagem de link aparece ao lado da dimensão - Estado. Isso indica a dimensão comum entre as duas fontes de dados.
  • Suponha que você crie um gráfico de barras com Taxa de lucro na prateleira da coluna e Estado no Row Shelf, o gráfico mostra como a proporção de lucro varia para cada estado, tanto na superloja quanto na rede de cafeterias.

Limitações da combinação de dados no Tableau

  1. Existem algumas limitações de combinação de dados em torno de agregados não aditivos, como MEDIANA , e RAWSQLAGG .
  2. A combinação de dados compromete a velocidade da consulta em alta granularidade.
  3. Quando você tenta classificar por um campo calculado que usa dados combinados, o campo calculado não é listado na lista suspensa Campo da caixa de diálogo Classificar.
  4. As fontes de dados de cubo só podem ser usadas como a fonte de dados primária para combinar dados no Tableau. Eles não podem ser usados ​​como fontes de dados secundárias.

Espero que todos vocês, agora, tenham uma boa ideia sobre Combinação de dados no Tableau deste blog. Quer mais conhecimento? Não se preocupe, este vídeo lhe dará uma melhor compreensão do conceito.