Estatísticas - padrões de dados

Os padrões de dados são muito úteis quando são desenhados graficamente. Padrões de dados comumente descritos em termos de recursos como centro, propagação, forma e outras propriedades incomuns. Outros rótulos descritivos especiais são simétricos, em forma de sino, inclinados, etc.

Centro

O centro de uma distribuição, graficamente, está localizado na mediana da distribuição. Esse gráfico mostra que quase metade das observações estão em ambos os lados. A altura de cada coluna indica a frequência das observações.

Propagação

A propagação de uma distribuição refere-se à variação dos dados. Se o conjunto de observação cobre uma ampla faixa, a dispersão é maior. Se as observações estiverem centradas em torno de um único valor, a dispersão será menor.

Forma

A forma de uma distribuição pode ser descrita usando as seguintes características.

  • Symmetry - Na distribuição simétrica, o gráfico pode ser dividido no centro de forma que cada metade seja uma imagem espelhada da outra.

  • Number of peaks.- Distribuições com um ou vários picos. A distribuição com um pico claro é conhecida como unimodal e a distribuição com dois picos claros é chamada bimodal. Uma distribuição simétrica de pico único no centro é conhecida como em forma de sino.

  • Skewness- Algumas distribuições podem ter múltiplas observações em um lado do gráfico e não no outro lado. Distribuições com menos observações para valores mais baixos são consideradas distorcidas para a direita; e as distribuições com menos observações para valores mais baixos são consideradas enviesadas para a esquerda.

  • Uniform - Quando o conjunto de observações não tem pico e tem dados igualmente espalhados por toda a faixa de distribuição, então a distribuição é chamada de distribuição uniforme.

Características incomuns

As características incomuns comuns dos padrões de dados são lacunas e outliers.

  • Gaps- Gaps aponta para áreas de uma distribuição sem observações. A figura a seguir tem uma lacuna, pois não há observações no meio da distribuição.

  • Outliers- As distribuições podem ser caracterizadas por valores extremos que diferem muito do outro conjunto de dados de observação. Esses valores extremos são chamados de outliers. A figura a seguir ilustra uma distribuição com um outlier.