O objetivo de qualquer ferramenta de BI é fornecer Análise de dados um fluxo melhor. Se alguém, como profissional, enfrenta a dificuldade de usar a ferramenta para resolver um problema, o estado de fluxo é interrompido. Uma causa comum deste problema é a necessidade de trabalhar com dados que foram agregados a diferentes Nível de detalhe no quadro (LOD) .
O Tableau colocado no topo da pilha pela 6ª vez consecutiva, no Quadrante Mágico do Gartner, definitivamente diz algo sobre sua demanda no mercado. Este é provavelmente o melhor momento para .
Este blog ajudará você a entender as expressões LOD e discutir os seguintes tópicos:
- Por que você precisa do nível de detalhe no Tableau?
- O que é nível de detalhe no Tableau?
- Expressões de nível de linha e nível de visualização
- Tipos de expressões LOD
- Agregação e expressões LOD
- Filtros e expressões LOD
- Criação de expressões LOD
- Fontes de dados que suportam o nível de detalhe no Tableau
- Cálculos de tabela versus nível de detalhe no Tableau
- Limitações de nível de detalhe no Tableau
Tableau LOD: Por que você precisa de LOD?
Freqüentemente, há perguntas que se deparam ao analisar dados. Essas perguntas costumam ser simples de fazer, mas difíceis de responder. Eles costumam soar como:
Para abordar esses tipos de questões, uma nova sintaxe foi introduzida chamada Nível de detalhe no Tableau 9.0. Essa nova sintaxe simplificou e ampliou a linguagem de cálculo do Tableau, tornando possível abordar essas questões diretamente.
você pode estender e implementar em java
Tableau LOD: O que é LOD?
As expressões de LOD representam uma maneira elegante e poderosa de responder a perguntas envolvendo vários níveis de granularidade em uma única visualização.
O nível de detalhe no Tableau ou as expressões LOD permitem que você calcule valores no nível da fonte de dados e no nível de visualização. No entanto, as expressões LOD fornecem ainda mais controle sobre o nível de granularidade que você deseja calcular. Eles podem ser realizados em um mais granular nível (INCLUIR Cálculo), um menos granular nível (EXCLUIR Cálculo), ou um totalmente independente leve l (Cálculo FIXO).
Tableau LOD: Expressões de nível de linha e nível de visualização
Nível de linha
No Tableau, expressões que fazem referência não agregado as colunas da fonte de dados são calculadas para cada linha na tabela subjacente. Neste caso, a dimensionalidade da expressão é nível de linha . Um exemplo de expressão em nível de linha é:
[Vendas] / [Lucro]
Este cálculo será avaliado em cada linha do banco de dados. O valor de vendas em cada linha será dividido pelo valor de lucro nessa linha, produzindo uma nova coluna com o resultado da multiplicação (uma relação de lucro).
Se você criar um cálculo com esta definição, salve-o com o nome [ProfitRatio] e, em seguida, arraste-o do Painel de dados em uma prateleira, o Tableau deve normalmente agregar o campo calculado para a exibição:
SUM [ProfitRatio]
Nível de visualização
Por outro lado, as expressões que fazem referência agregado as colunas da fonte de dados são calculadas na dimensionalidade definida pelas dimensões na exibição. Nesse caso, a dimensionalidade da expressão é o nível de visualização. Um exemplo de expressão no nível de visualização é:
SUM (Vendas) / SUM (Lucro)
Se você arrastar esse cálculo para uma prateleira (ou digitá-lo diretamente em uma prateleira como um cálculo ad-hoc), o Tableau o colocará em um Função AGG :
AGG (SUM (Vendas) / SUM (Lucro))
Isso é conhecido como Cálculo Agregado .
Tableau LOD: Agregação e expressões LOD
A expressão LOD é mais grosseira do que o nível de detalhe da vista
Uma expressão tem um nível de detalhe mais grosseiro do que a visualização quando faz referência a um subconjunto das dimensões na vista.
Por exemplo, para uma vista que continha as dimensões [Categoria] e [Segmento], você pode criar um nível de detalhe no Tableau que usa apenas uma destas dimensões:
{FIXED [Segment]: SUM ([Sales])}
Nesse caso, a expressão tem um nível de detalhe mais grosseiro do que a visualização. Baseia seus valores em uma dimensão ([Segmento]), enquanto a visualização se baseia em duas dimensões ([Segmento] e [Categoria]).
O resultado é que o uso do nível de expressão de detalhes na visualização faz com que certos valores sejam replicados, ou seja, aparecer várias vezes .
A expressão LOD é mais fina do que o nível de detalhe da vista
Uma expressão tem um nível mais preciso de detalhes do que a visualização quando faz referência a um superconjunto das dimensões na vista.
Quando você usa tal expressão na exibição, o Tableau agregará os resultados até o nível da exibição. Por exemplo, o seguinte nível de detalhe no Tableau faz referência a duas dimensões:
{FIXED [Segment], [Category]: SUM ([Sales])}
Quando esta expressão é usada em uma vista que tem apenas [Segment] como seu nível de detalhe, os valores deve ser agregado . Aqui está o que você veria se arrastasse essa expressão para uma estante:
AVG ([{FIXED [Segment]], [Category]]: SUM ([Sales]])}])
A agregação (neste caso, média) é atribuído automaticamente pelo Tableau. Você pode alterar a agregação conforme necessário.
Adicionando uma expressão LOD à visualização
Se um nível de detalhe na expressão do Tableau é agregado ou replicado na exibição é determinado pelo tipo de expressão e granularidade .
- As expressões INCLUDE terão o mesmo nível de detalhe da visualização ou um nível de detalhe mais refinado do que a visualização. Portanto, os valores nunca serão replicados.
- As expressões FIXED podem ter um nível de detalhe mais fino do que a visualização, um nível de detalhe mais grosseiro ou o mesmo nível de detalhe. A necessidade de agregar os resultados de um nível FIXO de detalhe depende de quais dimensões estão na vista.
- As expressões EXCLUDE sempre fazem com que os valores replicados apareçam na visualização. Quando cálculos incluindo expressões de nível de detalhe EXCLUIR são colocados em uma prateleira, o Tableau padroniza para Agregação ATTR ao contrário de SUM ou AVG, para indicar que a expressão não está realmente sendo agregada e que a alteração da agregação não afetará a exibição.
As expressões de nível de detalhe são sempre agrupadas automaticamente quando são adicionadas a uma prateleira na visualização, a menos que sejam usadas como dimensões.
Tableau LOD: Filtros e expressões LOD
A imagem aqui mostra oordem de execução dos filtros de cima para baixo.O texto à direita mostra onde as expressões LOD são avaliadas nesta sequência.
como fazer um jframe
Os filtros de extração (em laranja) são relevantes apenas se você estiver criando um extrato do Tableau a partir de uma fonte de dados. Filtros de cálculos de tabela (azul escuro) são aplicados depois que os cálculos são executados e, portanto, ocultam as marcas sem filtrar os dados subjacentes usados nos cálculos.
Cálculos CORRIGIDOS são aplicados antes dos filtros de dimensão, portanto, a menos que você promova os campos em sua divisória Filtro para Melhorar o Desempenho da Visualização com Filtros de Contexto, eles serão ignorados.
Tableau LOD: Tipos de expressões LOD
INCLUIR Cálculo
INCLUDE calcula os valores usando as dimensões especificadas, além de quaisquer dimensões que estejam na vista. Este nível de expressão de detalhe é mais útil ao incluir uma dimensão que não está na visualização.
Por exemplo: {INCLUIR [Nome do cliente]: SOMA ([Vendas])}
EXCLUIR Cálculo
EXCLUDE remove explicitamente as dimensões da expressão - ou seja, eles subtraem as dimensões do nível de detalhe da vista. Este nível de detalhe no Tableau é mais útil para eliminar uma dimensão na exibição.
Por exemplo: {EXCLUIR [Região]: SOMA ([Vendas])}
Cálculo FIXO
FIXED calcula valores usando as dimensões especificadas sem referência ao nível de detalhe da vista - isto é, sem referência a quaisquer outras dimensões na vista. Este nível de expressão de detalhe também ignora todos os filtros na exibição, exceto filtros de contexto, filtros de fonte de dados e filtros de extração.
Por exemplo: {FIXED [Região]: SUM ([Vendas])}
Tableau LOD: Criação de expressões LOD
Sintaxe de uma expressão LOD
Uma expressão de nível de detalhe tem a seguinte estrutura:
INCLUIR
Etapa 1: configurar a visualização
- Abra o Tableau Desktop e conecte-se ao Sample-Superstore fonte de dados salva.
- Navegue para uma nova planilha.
- De Dados painel, em Dimensões, arraste Região ao Colunas Estante.
- De Dados painel, em Medidas, arraste Vendas ao Linhas Estante. Um gráfico de barras mostrando a soma das vendas de cada região é exibido.
Etapa 2: Crie a expressão LOD
Em vez da soma de todas as vendas por região, talvez você também queira ver a média de vendas por cliente para cada região. Você pode usar uma expressão LOD para fazer isso.
- Selecione Análise > Criar Campo Calculado.
- No editor de cálculo que é aberto, faça o seguinte:
- Nomeie o cálculo, Vendas por cliente.
- Insira a seguinte expressão LOD:
{INCLUIR [Nome do cliente]: SOMA ([Vendas])}
- Quando terminar, clique Está bem. A expressão LOD recém-criada é adicionada ao painel Dados, em Medidas.
Etapa 3: use a expressão LOD na visualização
- De Dados painel, em Medidas, arraste Vendas por cliente ao Linhas prateleira e coloque-o à esquerda de SUM (Vendas).
- Na prateleira Linhas, clique com o botão direito Vendas por cliente e selecione Medida (soma) > Média. Agora você pode ver a soma de todas as vendas e a média de vendas por cliente para cada região. Por exemplo, você pode ver que na região Central, as vendas totalizaram aproximadamente 500.000 USD com uma venda média para cada cliente sendo aproximadamente 800 USD .
Tableau LOD: Fontes de dados que suportam expressões LOD
Fonte de dados | Suportado / Não Suportado |
Actian Vectorwise | Não suportado. |
Amazon EMR Hadoop Hive | Hive com suporte 0.13 em diante. |
Amazon Redshift | Suportado. |
Banco de dados Aster | Versão com suporte 4.5 em diante. |
Cloudera Hadoop | Hive com suporte 0.13 em diante. |
Cloudera Impala | Impala 1.2.2 com suporte em diante. |
Cubos (fontes de dados multidimensionais) | Não suportado. |
DataStax Enterprise | Não suportado. |
EXASOL | Suportado. |
Firebird | Versão 2.0 com suporte em diante. |
ODBC genérico | Limitado. Depende da fonte de dados. |
Google Big Query | Compatível com SQL padrão, não legado. |
IBM DB2 | Versão com suporte 8.1 em diante. |
MarkLogic | Versão com suporte 7.0 em diante. |
SAP HANA | Suportado. |
SAP Sybase ASE | Suportado. |
SAP Sybase IQ | Versão suportada 15.1 em diante. |
Spark SQL | Suportado. |
Splunk | Não suportado. |
Tabela de extração de dados | Suportado. |
Teradata | Suportado. |
Vertica | Versão com suporte 6.1 em diante. |
Microsoft Access | Não suportado. |
Conexões baseadas em Microsoft Jet | Não suportado. |
Hortonworks Hadoop Hive | Hive com suporte 0.13 em diante.como converter um duplo em um int java Na versão 1.1 do HIVE, as expressões LOD que produzem junções cruzadas não são confiáveis. |
IBM BigInsights | Suportado. |
Microsoft SQL Server | Compatível com SQL Server 2005 em diante. |
MySQL | Suportado. |
IBM PDA (Netezza) | Versão com suporte 7.0 em diante. |
Oráculo | Versão suportada 9i em diante. |
Matriz Actian (ParAccel) | Versão suportada 3.1 em diante. |
Pivotal Greenplum | Versão suportada 3.1 em diante. |
PostgreSQL | Versão com suporte 7.0 em diante. |
Progress OpenEdge | Suportado. |
Tableau LOD: Cálculos da tabela vs LOD
As expressões LOD não são uma nova forma de cálculos de tabela. Embora eles possam substituir muitos cálculos de tabela, seu principal objetivo é abrir novas possibilidades.As expressões LOD e os cálculos de tabela funcionam de maneira diferente.
Cálculos da Tabela | Expressões LOD |
Os cálculos da tabela são gerados por Resultados da Consulta . | As expressões LOD são geradas como parte da consulta para o fonte de dados subjacente . Eles são expressos como uma seleção aninhada, portanto, dependendo do desempenho do DBMS. |
Os cálculos da tabela podem só produzem resultados iguais ou menos granulares do que o dito LOD. | LOD pode produzir resultados independente do dito LOD . |
As dimensões que controlam as operações de uma tabela são separadas da sintaxe de cálculo. | As dimensões que controlam as operações de uma expressão LOD são embutido na expressão em si. |
Os cálculos da tabela são usados como medidas agregadas . | As expressões LOD podem ser usadas em outras construções. |
Filtros em cálculos de tabela agem como um OCULTAR . | Filtros no LOD agem como um EXCLUIR . |
Tableau LOD: Limitações do LOD
A seguir estão as restrições que se aplicam às expressões LOD.
- As expressões de LOD que fazem referência a medidas de ponto flutuante tendem a se comportar de maneira não confiável quando usadas em uma exibição que requer uma comparação dos valores na expressão.
- O LOD não é mostrado na página Fonte de dados.
- Ao fazer referência a um parâmetro em uma declaração de dimensionalidade, sempre use o nome do parâmetro, e não o valor do parâmetro.
- Com a combinação de dados, o campo de vinculação da fonte de dados primária deve estar na exibição antes que você possa usar uma expressão de nível de detalhe da fonte de dados secundária.
Além disso, algumas fontes de dados têm limites de complexidade. O Tableau não desabilitará cálculos para esses bancos de dados, mas erros de consulta são uma possibilidade se os cálculos se tornarem muito complexos.