Python Seaborn Tutorial: O que é Seaborn e como usá-lo?



Tutorial de Python Seaborn ao longo da diferença entre seaborn e matplotlib. Aprenda também sobre as várias funções e personalizações disponíveis no mar.

Python é um depósito de numerosas bibliotecas e estruturas imensamente poderosas. Entre eles, está Seaborn, que é um dominante Visualização de dados biblioteca, concedendo mais um motivo para os programadores concluírem . Neste Tutorial do Python Seaborn, você aprenderá todos os truques da visualização de dados usando o Seaborn.

Antes de prosseguir, vamos dar uma olhada em todos os tópicos de discussão neste artigo:





Então, vamos começar primeiro raciocinando sobre a importância do Python Seaborn.

Por que usar Python Seaborn?

Conforme mencionado anteriormente, a biblioteca Python Seaborn é usada para facilitar a tarefa desafiadora de visualização de dados e é baseada em . Seaborn permite a criação de gráficos estatísticos através das seguintes funcionalidades:



  • Uma API que se baseia em conjuntos de dados que permitem a comparação entre vários variáveis

  • Suporta grades multi-plot que por sua vez facilitam a construção de visualizações complexas

  • Visualizações univariadas e bivariadas disponíveis para comparação entre subconjuntos de dados



  • Disponibilidade de diferentes paletas de cores para revelar vários tipos de padrões

  • Estimativas e gráficos automaticamente

Então, se você está se perguntando por que usar o Seaborn quando já tem o Matplotlib, aqui está a resposta.

Python Seaborn vs Matplotlib:

“Se Matplotlib“ tenta tornar as coisas fáceis mais fáceis e as difíceis possíveis ”, o seaborn tenta fazer um conjunto bem definido de coisas difíceis fáceis também” - Michael Waskom (Criador do Seaborn).
Na verdade, Matplotlib é bom, mas Seaborn é melhor. Existem basicamente duas deficiências do Matplotlib que a Seaborn corrige:

  1. Matplotlib pode ser personalizado, mas é difícil descobrir quais configurações são necessárias para tornar os gráficos mais atraentes. Por outro lado, o Seaborn vem com vários temas personalizados e interfaces de alto nível para resolver esse problema.

  2. Ao trabalhar com Pandas , Matplotlib não funciona bem quando se trata de lidar com DataFrames, enquanto as funções Seaborn realmente funcionam em DataFrames.

Como instalar o Seaborn?

Para instalar a biblioteca Python Seaborn, você pode usar os seguintes comandos com base na plataforma que você usa:

pip install seaborn

ou

conda install seaborn

Depois de instalado, certifique-se de instalar os pacotes e bibliotecas dos quais o seaborn depende.

Instalação de dependências do Python Seaborn:

As dependências obrigatórias para nascidos no mar são:

Também existe uma dependência recomendada que é:

  • modelos de estado

Para instalar essas bibliotecas, você pode usar os mesmos comandos mostrados anteriormente para Seaborn com seus respectivos nomes. Depois de instalados, eles podem ser importados facilmente. Seaborn permite que você carregue qualquer conjunto de dados de usando o load_dataset () função. Você também pode visualizar todos os conjuntos de dados disponíveis usando a função get_dataset_names () da seguinte maneira:

EXEMPLO:

importar seaborn como sns sns.get_dataset_names ()

Isso retornará uma lista de todos os conjuntos de dados disponíveis.
Agora que você configurou seu ambiente para trabalhar com marítimos, vamos prosseguir para ver como usar suas funções de plotagem em .

Funções de plotagem Seaborn

Visualizando relações estatísticas:

O processo de compreensão das relações entre as variáveis ​​de um conjunto de dados e como essas relações, por sua vez, dependem de outras variáveis, é conhecido como análise estatística. Vamos agora dar uma olhada mais profunda nas funções necessárias para isso:

relplot ():

Esta é uma função de nível de figura que faz uso de duas outras funções de eixo para visualizar relações estatísticas, que são:

  • gráfico de dispersão ()
  • gráfico de linha ()

Essas funções podem ser especificadas usando o parâmetro 'tipo' de relplot (). Caso este parâmetro seja fornecido, ele assume o padrão que é scatterplot (). Antes de começar a escrever seu código, certifique-se de importar as bibliotecas necessárias da seguinte maneira:

import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns sns.set (style = 'darkgrid')

Observe que o atributo de estilo também é personalizável e pode assumir qualquer valor, como darkgrid, ticks, etc, que discutirei posteriormente na seção de estética do enredo. Vamos agora dar uma olhada em um pequeno exemplo:

EXEMPLO:

f = sns.load_dataset ('voos') sns.relplot (x = 'passageiros', y = 'mês', dados = f)

RESULTADO:

Flights1-Python Seaborn Tutorial-Edureka

Como você pode ver, os pontos são plotados em 2 dimensões. No entanto, você pode adicionar outra dimensão usando a semântica 'matiz'. Vamos dar uma olhada em um exemplo do mesmo:

EXEMPLO:

f = sns.load_dataset ('voos') sns.relplot (x = 'passageiros', y = 'mês', hue = 'ano', dados = f)

Você verá a seguinte saída:

RESULTADO:

No entanto, existem muitas outras personalizações que você pode experimentar, como cores, estilos, tamanho etc. Deixe-me mostrar como você pode alterar a cor no exemplo a seguir:

EXEMPLO:

sns.set (style = 'darkgrid') f = sns.load_dataset ('voos') sns.relplot (x = 'passageiros', y = 'mês', hue = 'ano', paleta = 'ch: r = - 0,5, l = 0,75 ', dados = f)

RESULTADO:

gráfico de linha ():

Esta função permitirá que você desenhe uma linha contínua para seus dados. Você pode usar esta função alterando o parâmetro 'tipo' da seguinte forma:

EXEMPLO:

a = pd.DataFrame ({'Dia': [1,2,3,4,5,6,7], 'Mercearia': [30,80,45,23,51,46,76], 'Roupas' : [13,40,34,23,54,67,98], 'Utensílios': [12,32,27,56,87,54,34]}, índice = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Dia', y = 'Roupas', tipo = 'linha', dados = a) g.fig.autofmt_xdate ()

RESULTADO:

O padrão para o gráfico de linha é y em função de x. No entanto, ele pode ser alterado se você desejar. Existem muitas outras opções que você pode experimentar.

Agora vamos dar uma olhada em como plotar dados categóricos.

Plotando com dados categóricos:

Essa abordagem entra em cena quando nossa variável principal é posteriormente dividida em grupos discretos (categóricos). Isso pode ser feito usando a função catplot ().

catplot ():

Esta é uma função de nível de figura como relplot (). Pode ser caracterizado por três famílias de funções de nível de eixos, a saber:

  1. Scatterplots - Incluem stripplot (), swarmplot ()

  2. Gráficos de distribuição - que são boxplot (), violinplot (), boxenplot ()

  3. Gráficos de estimativa - ou seja, pointplot (), barplot (), countplot ()

Vamos agora dar alguns exemplos para demonstrar isso:

EXEMPLO:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('dicas') sns.catplot (x = 'dia', y = 'total_bill', dados = a)

RESULTADO:

Como você pode ver, no exemplo acima, eu não configurei o parâmetro 'tipo'. Portanto, ele retornou o gráfico como o gráfico de dispersão padrão. Você pode especificar qualquer função de nível de eixo para alterar o gráfico conforme necessário. Vamos dar um exemplo disso também:

EXEMPLO:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('dicas') sns.catplot (x = 'dia', y = 'total_bill', kind = 'violino', data = a)

RESULTADO:

A saída acima mostra o violinplot para o conjunto de dados de dicas. Agora vamos tentar descobrir como visualizar a distribuição de um conjunto de dados.

Visualizando a distribuição de um conjunto de dados:

Isso basicamente lida com a compreensão de conjuntos de dados com contexto para serem univariados ou bivariados. Antes de começar, basta importar o seguinte:

import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from scipy import stats sns.set (color_codes = True)

Uma vez feito isso, você pode continuar plotando distribuições univariadas e bivariadas.

Traçando distribuições univariadas:

Para representá-los, você pode usar a função distplot () da seguinte maneira:

EXEMPLO:

a = np.random.normal (loc = 5, size = 100, scale = 2) sns.distplot (a)

RESULTADO:

Como você pode ver no exemplo acima, traçamos um gráfico para a variável a cujos valores são gerados pela função normal () usando distplot.

Traçando distribuições bivariadas:

Isso fica claro quando você tem duas variáveis ​​independentes aleatórias resultando em algum evento provável. A melhor função para plotar esse tipo de gráfico é jointplot (). Vamos agora traçar um gráfico bivariado usando jointplot ().

EXEMPLO:

x = pd.DataFrame ({'Dia': [1,2,3,4,5,6,7], 'Mercearia': [30,80,45,23,51,46,76], 'Roupas' : [13,40,34,23,54,67,98], 'Utensílios': [12,32,27,56,87,54,34]}, índice = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Dia': [8,9,10,11,12,13,14], 'Mercearia': [30,80,45,23,51,46, 76], 'Roupas': [13,40,34,23,54,67,98], 'Utensílios': [12,32,27,56,87,54,34]}, índice = [8,9 , 10,11,12,13,14]) média, cov = [0, 1], [(1, .5), (.5, 1)] dados = np.random.multivariate_normal (média, cov, 200 ) com sns.axes_style ('white'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

RESULTADO:

Agora que você entendeu as várias funções do Python Seaborn, vamos prosseguir para construir grades estruturadas de múltiplas parcelas.

Grades Multi-Plot:

O Python Seaborn permite que você plote várias grades lado a lado. Esses são basicamente plotagens ou gráficos que são plotados usando a mesma escala e eixos para auxiliar na comparação entre eles. Isso, por sua vez, ajuda o programador a diferenciar rapidamente os gráficos e obter grandes quantidades de informações.

Considere o seguinte exemplo da função facetgrid () para plotar esses gráficos.

EXEMPLO:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'species') b.map (plt.hist, 'sepal_length')

RESULTADO:

O resultado acima mostra claramente a comparação entre as dicas que são dadas durante o almoço e o jantar. Você também pode plotar usando a função PairGrid quando tiver um par de variáveis ​​para comparar. Considere o seguinte exemplo.

EXEMPLO:

sns.set (style = 'ticks') a = sns.load_dataset ('flight') b = sns.PairGrid (a) b.map (plt.scatter)

RESULTADO:

Como você pode ver, o resultado acima se compara claramente entre o ano e o número de passageiros de maneiras diferentes.

vale a pena pmi-acp

Seaborn também permite personalizações em relação à estética, que será discutida mais adiante.

Enredo-Estética:

Este segmento do tutorial do Python Seaborn trata de tornar nossos enredos mais atraentes e agradáveis.

Figura-Estética Python Seaborn:

A primeira função que discutirei é set (). Eu tenho usado o parâmetro 'estilo' desta função antes. Este parâmetro trata basicamente de temas marítimos. Actualmente, existem cinco disponíveis, nomeadamente darkgrid, ticks, whitegrid, white e dark.

Considere o seguinte exemplo que demonstra o tema branco.

EXEMPLO:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('dicas') sns.boxplot (x = 'dia', y = 'total_bill', dados = a)

RESULTADO:

Na saída acima, você pode notar que o tema foi alterado para branco. Você pode explorá-los ainda mais usando outros temas também. Se você notar na saída anterior, há eixos presentes em todo o gráfico. No entanto, isso também é personalizável usando a função despine (). Veja o exemplo abaixo.

EXEMPLO:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('dicas') sns.boxplot (x = 'dia', y = 'total_bill', data = a) sns.despine (offset = 10, trim = True)

RESULTADO:



Observe a diferença entre as duas saídas anteriores. No entanto, existem muitas outras opções que você pode explorar por si mesmo.

Paletas de cores Python Seaborn:

A cor é basicamente a característica que mais se aproxima dos olhos humanos além de qualquer outra característica. Seaborn permite que você brinque com as cores usando várias funções, como color_palette (), hls_palette (), husl_palette (), etc.

EXEMPLO:

import numpy as np import seaborn as sns import matplotlib.pyplot as plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

RESULTADO:

A imagem acima mostra as cores que estão presentes dentro do mar. Eu fiz isso usando a função palplot (). Para variações mais profundas, você pode usar hls_palette (), husl_palette (), etc.

Isso nos leva ao final do Tutorial do Python Seaborn. Espero que você tenha entendido tudo claramente. Certifique-se de praticar o máximo possível .

Tem alguma questão para nós? Mencione isso na seção de comentários deste blog “Python Seaborn Tutorial” e entraremos em contato com você o mais breve possível.

Para obter conhecimento aprofundado sobre Python, juntamente com seus vários aplicativos, você pode se inscrever para com suporte 24/7 e acesso vitalício.