Estatísticas - Coeficiente de correlação

Coeficiente de correlação

Um coeficiente de correlação é uma medida estatística do grau em que as alterações no valor de uma variável prevêem alterações no valor de outra. Em variáveis ​​positivamente correlacionadas, o valor aumenta ou diminui em tandem. Em variáveis ​​negativamente correlacionadas, o valor de uma aumenta à medida que o valor da outra diminui.

Os coeficientes de correlação são expressos como valores entre +1 e -1.

Um coeficiente de +1 indica uma correlação positiva perfeita: uma mudança no valor de uma variável irá prever uma mudança na mesma direção na segunda variável.

Um coeficiente de -1 indica um negativo perfeito: uma mudança no valor de uma variável prevê uma mudança na direção oposta na segunda variável. Graus menores de correlação são expressos como decimais diferentes de zero. Um coeficiente de zero indica que não há relação discernível entre as flutuações das variáveis.

Fórmula

$ {r = \ frac {N \ sum xy - (\ sum x) (\ sum y)} {\ sqrt {[N \ sum x ^ 2 - (\ sum x) ^ 2] [N \ sum y ^ 2 - (\ sum y) ^ 2]}}} $

Onde -

  • $ {N} $ = Número de pares de pontuações

  • $ {\ sum xy} $ = Soma dos produtos das pontuações emparelhadas.

  • $ {\ sum x} $ = Soma de x pontuações.

  • $ {\ sum y} $ = Soma das pontuações de y.

  • $ {\ sum x ^ 2} $ = Soma das pontuações x ao quadrado.

  • $ {\ sum y ^ 2} $ = Soma das pontuações de y ao quadrado.

Exemplo

Problem Statement:

Calcule o coeficiente de correlação do seguinte:

X Y
1 2
3 5
4 5
4 8

Solution:

$ {\ soma xy = (1) (2) + (3) (5) + (4) (5) + (4) (8) = 69 \\ [7pt] \ soma x = 1 + 3 + 4 + 4 = 12 \\ [7pt] \ sum y = 2 + 5 + 5 + 8 = 20 \\ [7pt] \ sum x ^ 2 = 1 ^ 2 + 3 ^ 2 + 4 ^ 2 + 4 ^ 2 = 42 \ \ [7pt] \ sum y ^ 2 = 2 ^ 2 + 5 ^ 2 + 5 ^ 2 + 8 ^ 2 = 118 \\ [7pt] r = \ frac {69 - \ frac {(12) (20)} { 4}} {\ sqrt {(42 - \ frac {(12) ^ 2} {4}) (118- \ frac {(20) ^ 2} {4}}} \\ [7pt] = 0,866} $