Estatísticas - Curtose

O grau de cauda de uma distribuição é medido por curtose. Ela nos diz até que ponto a distribuição é mais ou menos propensa a outliers (mais pesada ou de cauda leve) do que a distribuição normal. Três tipos diferentes de curvas, cortesia da Investopedia, são mostrados a seguir -

É difícil discernir diferentes tipos de curtose nos gráficos de densidade (painel esquerdo) porque as caudas são próximas de zero para todas as distribuições. Mas as diferenças nas caudas são fáceis de ver nos gráficos quantil-quantil normais (painel direito).

A curva normal é chamada de curva mesocúrtica. Se a curva de uma distribuição é mais propensa a outliers (ou cauda mais pesada) do que uma curva normal ou mesocúrtica, então ela é chamada de curva leptocúrtica. Se uma curva é menos propensa a outliers (ou cauda mais clara) do que uma curva normal, é chamada de curva platicúrtica. A curtose é medida por momentos e é dada pela seguinte fórmula -

Fórmula

$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $

Onde -

  • $ {\ mu_4 = \ frac {\ sum (x- \ bar x) ^ 4} {N}} $

Quanto maior o valor de \ beta_2, mais pontiaguda ou leptocúrtica é a curva. Uma curva normal tem um valor de 3, um leptocúrtico tem \ beta_2 maior que 3 e platicúrtico tem \ beta_2 menor que 3.

Exemplo

Problem Statement:

São apresentados os dados sobre o salário diário de 45 trabalhadores de uma fábrica. Calcule \ beta_1 e \ beta_2 usando o momento sobre a média. Comente os resultados.

Salários (Rs.) Número de Trabalhadores
100-200 1
120-200 2
140-200 6
160-200 20
180-200 11
200-200 3
220-200 2

Solution:

Salários
(Rs.)
Número de trabalhadores
(f)
Ponto médio
m
m - $ {\ frac {170} {20}} $
d
$ {fd} $ $ {fd ^ 2} $ $ {fd ^ 3} $ $ {fd ^ 4} $
100-200 1 110 -3 -3 9 -27 81
120-200 2 130 -2 -4 8 -16 32
140-200 6 150 -1 -6 6 -6 6
160-200 20 170 0 0 0 0 0
180-200 11 190 1 11 11 11 11
200-200 3 210 2 6 12 24 48
220-200 2 230 3 6 18 54 162
  $ {N = 45} $     $ {\ sum fd = 10} $ $ {\ sum fd ^ 2 = 64} $ $ {\ sum fd ^ 3 = 40} $ $ {\ sum fd ^ 4 = 330} $

Como os desvios foram tomados de uma média presumida, portanto, primeiro calculamos os momentos sobre a origem arbitrária e, em seguida, os momentos sobre a média. Momentos sobre origem arbitrária '170'

$ {\ mu_1 ^ 1 = \ frac {\ sum fd} {N} \ vezes i = \ frac {10} {45} \ times 20 = 4,44 \\ [7pt] \ mu_2 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ times i ^ 2 = \ frac {64} {45} \ times 20 ^ 2 = 568,88 \\ [7pt] \ mu_3 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ vezes i ^ 3 = \ frac {40} {45} \ times 20 ^ 3 = 7111,11 \\ [7pt] \ mu_4 ^ 1 = \ frac {\ sum fd ^ 4} {N} \ vezes i ^ 4 = \ frac {330} {45} \ vezes 20 ^ 4 = 1173333,33} $

Momentos maldosos

$ {\ mu_2 = \ mu'_2 - (\ mu'_1) ^ 2 = 568,88- (4,44) ^ 2 = 549,16 \\ [7pt] \ mu_3 = \ mu'_3 - 3 (\ mu'_1) (\ mu'_2) + 2 (\ mu'_1) ^ 3 \\ [7pt] \, = 7111,11 - (4,44) (568,88) + 2 (4,44) ^ 3 \\ [7pt] \, = 7111,11 - 7577,48 + 175,05 = - 291,32 \\ [7pt] \\ [7pt] \ mu_4 = \ mu'_4 - 4 (\ mu'_1) (\ mu'_3) + 6 (\ mu_1) ^ 2 (\ mu'_2) -3 (\ mu'_1) ^ 4 \\ [7pt] \, = 1173333,33 - 4 (4,44) (7111,11) +6 (4,44) ^ 2 (568,88) - 3 (4,44) ^ 4 \\ [7pt] \, = 1173333,33 - 126293,31 + 67288,03-1165,87 \\ [7pt] \, = 1113162,18} $

A partir do valor do movimento sobre a média, podemos agora calcular $ {\ beta_1} $ e $ {\ beta_2} $:

$ {\ beta_1 = \ mu ^ 2_3 = \ frac {(- 291,32) ^ 2} {(549,16) ^ 3} = 0,00051 \\ [7pt] \ beta_2 = \ frac {\ mu_4} {(\ mu_2) ^ 2 } = \ frac {1113162,18} {(546,16) ^ 2} = 3,69} $

A partir dos cálculos acima, pode-se concluir que $ {\ beta_1} $, que mede a assimetria, é quase zero, indicando que a distribuição é quase simétrica. $ {\ beta_2} $ que mede a curtose, tem um valor maior que 3, o que implica que a distribuição é leptocúrtica.