Estatísticas - análise residual

A análise de resíduos é usada para avaliar a adequação de um modelo de regressão linear, definindo os resíduos e examinando os gráficos do gráfico de resíduos.

Residual

Residual ($ e $) se refere à diferença entre o valor observado ($ y $) e o valor predito ($ \ hat y $). Cada ponto de dados tem um resíduo.

$ {residual = observadoValue - predictedValue \\ [7pt] e = y - \ hat y} $

Lote Residual

Um gráfico residual é um gráfico no qual os resíduos estão no eixo vertical e a variável independente está no eixo horizontal. Se os pontos estiverem dispersos aleatoriamente em torno do eixo horizontal, um modelo de regressão linear é apropriado para os dados; caso contrário, escolha um modelo não linear.

Tipos de plotagem residual

O exemplo a seguir mostra alguns padrões em plotagens residuais.

No primeiro caso, os pontos são dispersos aleatoriamente. Portanto, o modelo de regressão linear é o preferido. No segundo e no terceiro caso, os pontos são dispersos não aleatoriamente e sugere que um método de regressão não linear é preferido.

Exemplo

Problem Statement:

Verifique onde um modelo de regressão linear é apropriado para os dados a seguir.

$ x $ 60 70 80 85 95
$ y $ (valor real) 70 65 70 95 85
$ \ hat y $ (valor previsto) 65.411 71.849 78,288 81,507 87.945

Solution:

Step 1: Calcule os resíduos para cada ponto de dados.

$ x $ 60 70 80 85 95
$ y $ (valor real) 70 65 70 95 85
$ \ hat y $ (valor previsto) 65.411 71.849 78,288 81,507 87.945
$ e $ (residual) 4.589 -6.849 -8,288 13,493 -2.945

Step 2: - Desenhe o gráfico residual.

Step 3: - Verifique a aleatoriedade dos resíduos.

Aqui, o gráfico residual exibe um padrão aleatório - o primeiro residual é positivo, os dois seguintes são negativos, o quarto é positivo e o último residual é negativo. Como o padrão é bastante aleatório, o que indica que um modelo de regressão linear é apropriado para os dados acima.