Como as expressões LOD funcionam no Tableau?



As expressões LOD do Tableau representam uma maneira elegante e poderosa de responder a perguntas que envolvem vários níveis de granularidade em uma única visualização.

O objetivo de qualquer ferramenta de BI é fornecer Análise de dados um fluxo melhor. Se alguém, como profissional, enfrenta a dificuldade de usar a ferramenta para resolver um problema, o estado de fluxo é interrompido. Uma causa comum deste problema é a necessidade de trabalhar com dados que foram agregados a diferentes Nível de detalhe no quadro (LOD) .

O Tableau colocado no topo da pilha pela 6ª vez consecutiva, no Quadrante Mágico do Gartner, definitivamente diz algo sobre sua demanda no mercado. Este é provavelmente o melhor momento para .





Este blog ajudará você a entender as expressões LOD e discutir os seguintes tópicos:



Tableau LOD: Por que você precisa de LOD?

Freqüentemente, há perguntas que se deparam ao analisar dados. Essas perguntas costumam ser simples de fazer, mas difíceis de responder. Eles costumam soar como:

Perguntas no Tableau - Tableau LOD - EdurekaPara abordar esses tipos de questões, uma nova sintaxe foi introduzida chamada Nível de detalhe no Tableau 9.0. Essa nova sintaxe simplificou e ampliou a linguagem de cálculo do Tableau, tornando possível abordar essas questões diretamente.

você pode estender e implementar em java

Tableau LOD: O que é LOD?

As expressões de LOD representam uma maneira elegante e poderosa de responder a perguntas envolvendo vários níveis de granularidade em uma única visualização.



O nível de detalhe no Tableau ou as expressões LOD permitem que você calcule valores no nível da fonte de dados e no nível de visualização. No entanto, as expressões LOD fornecem ainda mais controle sobre o nível de granularidade que você deseja calcular. Eles podem ser realizados em um mais granular nível (INCLUIR Cálculo), um menos granular nível (EXCLUIR Cálculo), ou um totalmente independente leve l (Cálculo FIXO).

Tableau LOD: Expressões de nível de linha e nível de visualização

Nível de linha

No Tableau, expressões que fazem referência não agregado as colunas da fonte de dados são calculadas para cada linha na tabela subjacente. Neste caso, a dimensionalidade da expressão é nível de linha . Um exemplo de expressão em nível de linha é:

[Vendas] / [Lucro]

Este cálculo será avaliado em cada linha do banco de dados. O valor de vendas em cada linha será dividido pelo valor de lucro nessa linha, produzindo uma nova coluna com o resultado da multiplicação (uma relação de lucro).

Se você criar um cálculo com esta definição, salve-o com o nome [ProfitRatio] e, em seguida, arraste-o do Painel de dados em uma prateleira, o Tableau deve normalmente agregar o campo calculado para a exibição:

SUM [ProfitRatio]

Nível de visualização

Por outro lado, as expressões que fazem referência agregado as colunas da fonte de dados são calculadas na dimensionalidade definida pelas dimensões na exibição. Nesse caso, a dimensionalidade da expressão é o nível de visualização. Um exemplo de expressão no nível de visualização é:

SUM (Vendas) / SUM (Lucro)

Se você arrastar esse cálculo para uma prateleira (ou digitá-lo diretamente em uma prateleira como um cálculo ad-hoc), o Tableau o colocará em um Função AGG :

AGG (SUM (Vendas) / SUM (Lucro))

Isso é conhecido como Cálculo Agregado .

Tableau LOD: Agregação e expressões LOD

A expressão LOD é mais grosseira do que o nível de detalhe da vista

Uma expressão tem um nível de detalhe mais grosseiro do que a visualização quando faz referência a um subconjunto das dimensões na vista.

Por exemplo, para uma vista que continha as dimensões [Categoria] e [Segmento], você pode criar um nível de detalhe no Tableau que usa apenas uma destas dimensões:

{FIXED [Segment]: SUM ([Sales])}

Nesse caso, a expressão tem um nível de detalhe mais grosseiro do que a visualização. Baseia seus valores em uma dimensão ([Segmento]), enquanto a visualização se baseia em duas dimensões ([Segmento] e [Categoria]).

O resultado é que o uso do nível de expressão de detalhes na visualização faz com que certos valores sejam replicados, ou seja, aparecer várias vezes .

A expressão LOD é mais fina do que o nível de detalhe da vista

Uma expressão tem um nível mais preciso de detalhes do que a visualização quando faz referência a um superconjunto das dimensões na vista.

Quando você usa tal expressão na exibição, o Tableau agregará os resultados até o nível da exibição. Por exemplo, o seguinte nível de detalhe no Tableau faz referência a duas dimensões:

{FIXED [Segment], [Category]: SUM ([Sales])}

Quando esta expressão é usada em uma vista que tem apenas [Segment] como seu nível de detalhe, os valores deve ser agregado . Aqui está o que você veria se arrastasse essa expressão para uma estante:

AVG ([{FIXED [Segment]], [Category]]: SUM ([Sales]])}])

A agregação (neste caso, média) é atribuído automaticamente pelo Tableau. Você pode alterar a agregação conforme necessário.

Adicionando uma expressão LOD à visualização

Se um nível de detalhe na expressão do Tableau é agregado ou replicado na exibição é determinado pelo tipo de expressão e granularidade .

  • As expressões INCLUDE terão o mesmo nível de detalhe da visualização ou um nível de detalhe mais refinado do que a visualização. Portanto, os valores nunca serão replicados.
  • As expressões FIXED podem ter um nível de detalhe mais fino do que a visualização, um nível de detalhe mais grosseiro ou o mesmo nível de detalhe. A necessidade de agregar os resultados de um nível FIXO de detalhe depende de quais dimensões estão na vista.
  • As expressões EXCLUDE sempre fazem com que os valores replicados apareçam na visualização. Quando cálculos incluindo expressões de nível de detalhe EXCLUIR são colocados em uma prateleira, o Tableau padroniza para Agregação ATTR ao contrário de SUM ou AVG, para indicar que a expressão não está realmente sendo agregada e que a alteração da agregação não afetará a exibição.

As expressões de nível de detalhe são sempre agrupadas automaticamente quando são adicionadas a uma prateleira na visualização, a menos que sejam usadas como dimensões.

Tableau LOD: Filtros e expressões LOD

A imagem aqui mostra oordem de execução dos filtros de cima para baixo.O texto à direita mostra onde as expressões LOD são avaliadas nesta sequência.

como fazer um jframe

Os filtros de extração (em laranja) são relevantes apenas se você estiver criando um extrato do Tableau a partir de uma fonte de dados. Filtros de cálculos de tabela (azul escuro) são aplicados depois que os cálculos são executados e, portanto, ocultam as marcas sem filtrar os dados subjacentes usados ​​nos cálculos.

Cálculos CORRIGIDOS são aplicados antes dos filtros de dimensão, portanto, a menos que você promova os campos em sua divisória Filtro para Melhorar o Desempenho da Visualização com Filtros de Contexto, eles serão ignorados.

Tableau LOD: Tipos de expressões LOD

INCLUIR Cálculo

INCLUDE calcula os valores usando as dimensões especificadas, além de quaisquer dimensões que estejam na vista. Este nível de expressão de detalhe é mais útil ao incluir uma dimensão que não está na visualização.

Por exemplo: {INCLUIR [Nome do cliente]: SOMA ([Vendas])}

EXCLUIR Cálculo

EXCLUDE remove explicitamente as dimensões da expressão - ou seja, eles subtraem as dimensões do nível de detalhe da vista. Este nível de detalhe no Tableau é mais útil para eliminar uma dimensão na exibição.

Por exemplo: {EXCLUIR [Região]: SOMA ([Vendas])}

Cálculo FIXO

FIXED calcula valores usando as dimensões especificadas sem referência ao nível de detalhe da vista - isto é, sem referência a quaisquer outras dimensões na vista. Este nível de expressão de detalhe também ignora todos os filtros na exibição, exceto filtros de contexto, filtros de fonte de dados e filtros de extração.

Por exemplo: {FIXED [Região]: SUM ([Vendas])}

Tableau LOD: Criação de expressões LOD

Sintaxe de uma expressão LOD

Uma expressão de nível de detalhe tem a seguinte estrutura:

INCLUIR

Etapa 1: configurar a visualização

  1. Abra o Tableau Desktop e conecte-se ao Sample-Superstore fonte de dados salva.
  2. Navegue para uma nova planilha.
  3. De Dados painel, em Dimensões, arraste Região ao Colunas Estante.
  4. De Dados painel, em Medidas, arraste Vendas ao Linhas Estante. Um gráfico de barras mostrando a soma das vendas de cada região é exibido.

Etapa 2: Crie a expressão LOD

Em vez da soma de todas as vendas por região, talvez você também queira ver a média de vendas por cliente para cada região. Você pode usar uma expressão LOD para fazer isso.

  1. Selecione Análise > Criar Campo Calculado.
  2. No editor de cálculo que é aberto, faça o seguinte:
    • Nomeie o cálculo, Vendas por cliente.
    • Insira a seguinte expressão LOD:

      {INCLUIR [Nome do cliente]: SOMA ([Vendas])}

  3. Quando terminar, clique Está bem. A expressão LOD recém-criada é adicionada ao painel Dados, em Medidas.

Etapa 3: use a expressão LOD na visualização

  1. De Dados painel, em Medidas, arraste Vendas por cliente ao Linhas prateleira e coloque-o à esquerda de SUM (Vendas).
  2. Na prateleira Linhas, clique com o botão direito Vendas por cliente e selecione Medida (soma) > Média. Agora você pode ver a soma de todas as vendas e a média de vendas por cliente para cada região. Por exemplo, você pode ver que na região Central, as vendas totalizaram aproximadamente 500.000 USD com uma venda média para cada cliente sendo aproximadamente 800 USD .

Tableau LOD: Fontes de dados que suportam expressões LOD

Fonte de dados Suportado / Não Suportado
Actian VectorwiseNão suportado.
Amazon EMR Hadoop HiveHive com suporte 0.13 em diante.
Amazon RedshiftSuportado.
Banco de dados AsterVersão com suporte 4.5 em diante.
Cloudera HadoopHive com suporte 0.13 em diante.
Cloudera ImpalaImpala 1.2.2 com suporte em diante.
Cubos (fontes de dados multidimensionais)Não suportado.
DataStax EnterpriseNão suportado.
EXASOLSuportado.
FirebirdVersão 2.0 com suporte em diante.
ODBC genéricoLimitado. Depende da fonte de dados.
Google Big QueryCompatível com SQL padrão, não legado.
IBM DB2Versão com suporte 8.1 em diante.
MarkLogicVersão com suporte 7.0 em diante.
SAP HANASuportado.
SAP Sybase ASESuportado.
SAP Sybase IQVersão suportada 15.1 em diante.
Spark SQLSuportado.
SplunkNão suportado.
Tabela de extração de dadosSuportado.
TeradataSuportado.
VerticaVersão com suporte 6.1 em diante.
Microsoft AccessNão suportado.
Conexões baseadas em Microsoft JetNão suportado.
Hortonworks Hadoop HiveHive com suporte 0.13 em diante.

como converter um duplo em um int java

Na versão 1.1 do HIVE, as expressões LOD que produzem junções cruzadas não são confiáveis.

IBM BigInsightsSuportado.
Microsoft SQL ServerCompatível com SQL Server 2005 em diante.
MySQLSuportado.
IBM PDA (Netezza)Versão com suporte 7.0 em diante.
OráculoVersão suportada 9i em diante.
Matriz Actian (ParAccel)Versão suportada 3.1 em diante.
Pivotal GreenplumVersão suportada 3.1 em diante.
PostgreSQLVersão com suporte 7.0 em diante.
Progress OpenEdgeSuportado.

Tableau LOD: Cálculos da tabela vs LOD

As expressões LOD não são uma nova forma de cálculos de tabela. Embora eles possam substituir muitos cálculos de tabela, seu principal objetivo é abrir novas possibilidades.As expressões LOD e os cálculos de tabela funcionam de maneira diferente.

Cálculos da Tabela Expressões LOD
Os cálculos da tabela são gerados por Resultados da Consulta .As expressões LOD são geradas como parte da consulta para o fonte de dados subjacente . Eles são expressos como uma seleção aninhada, portanto, dependendo do desempenho do DBMS.
Os cálculos da tabela podem só produzem resultados iguais ou menos granulares do que o dito LOD.LOD pode produzir resultados independente do dito LOD .
As dimensões que controlam as operações de uma tabela são separadas da sintaxe de cálculo.As dimensões que controlam as operações de uma expressão LOD são embutido na expressão em si.
Os cálculos da tabela são usados ​​como medidas agregadas .As expressões LOD podem ser usadas em outras construções.
Filtros em cálculos de tabela agem como um OCULTAR .Filtros no LOD agem como um EXCLUIR .

Tableau LOD: Limitações do LOD

A seguir estão as restrições que se aplicam às expressões LOD.

  • As expressões de LOD que fazem referência a medidas de ponto flutuante tendem a se comportar de maneira não confiável quando usadas em uma exibição que requer uma comparação dos valores na expressão.
  • O LOD não é mostrado na página Fonte de dados.
  • Ao fazer referência a um parâmetro em uma declaração de dimensionalidade, sempre use o nome do parâmetro, e não o valor do parâmetro.
  • Com a combinação de dados, o campo de vinculação da fonte de dados primária deve estar na exibição antes que você possa usar uma expressão de nível de detalhe da fonte de dados secundária.

Além disso, algumas fontes de dados têm limites de complexidade. O Tableau não desabilitará cálculos para esses bancos de dados, mas erros de consulta são uma possibilidade se os cálculos se tornarem muito complexos.