Seaborn - Estimativa Estatística

Na maioria das situações, lidamos com estimativas de toda a distribuição dos dados. Mas quando se trata de estimativa de tendência central, precisamos de uma maneira específica de resumir a distribuição. A média e a mediana são as técnicas muito utilizadas para estimar a tendência central da distribuição.

Em todas as plotagens que aprendemos na seção acima, fizemos a visualização de toda a distribuição. Agora, vamos discutir sobre os gráficos com os quais podemos estimar a tendência central da distribuição.

Bar Plot

o barplot()mostra a relação entre uma variável categórica e uma variável contínua. Os dados são representados em barras retangulares, onde o comprimento da barra representa a proporção dos dados nessa categoria.

O gráfico de barras representa a estimativa da tendência central. Vamos usar o conjunto de dados 'titânico' para aprender gráficos de barras.

Exemplo

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.barplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

Resultado

No exemplo acima, podemos ver o número médio de sobreviventes de machos e fêmeas em cada classe. A partir do gráfico, podemos entender que mais mulheres sobreviveram do que homens. Tanto em homens quanto em mulheres, o maior número de sobreviventes é de primeira classe.

Um caso especial no gráfico de barras é mostrar o número de observações em cada categoria, em vez de calcular uma estatística para uma segunda variável. Para isso, usamoscountplot().

Exemplo

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.countplot(x = " class ", data = df, palette = "Blues");
plt.show()

Resultado

O enredo diz que, o número de passageiros na terceira classe é maior do que na primeira e segunda classes.

Gráficos de pontos

Os gráficos de pontos funcionam da mesma forma que os gráficos de barra, mas em um estilo diferente. Em vez da barra inteira, o valor da estimativa é representado pelo ponto em uma certa altura no outro eixo.

Exemplo

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.pointplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

Resultado