Séries temporais - Métricas de erro

É importante para nós quantificar o desempenho de um modelo para usá-lo como um feedback e comparação. Neste tutorial, usamos um dos mais populares erros métricos de raiz quadrada média de erro. Existem várias outras métricas de erro disponíveis. Este capítulo os discute resumidamente.

Erro Quadrado Médio

É a média do quadrado da diferença entre os valores previstos e os valores verdadeiros. Sklearn fornece isso como uma função. Tem as mesmas unidades que os valores verdadeiros e previstos ao quadrado e é sempre positivo.

$$ MSE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ lgrupo y '_ {t} \: - y_ {t} \ rgrupo ^ {2} $$

Onde $ y '_ {t} $ é o valor previsto,

$ y_ {t} $ é o valor real, e

n é o número total de valores no conjunto de teste.

É claro a partir da equação que o MSE é mais penalizante para erros maiores, ou outliers.

Erro de raiz quadrada média

É a raiz quadrada do erro quadrático médio. Também é sempre positivo e está no intervalo dos dados.

$$ RMSE = \ sqrt {\ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ lgrupo y '_ {t} -y_ {t} \ rgrupo ^ 2} $$

Onde, $ y '_ {t} $ é o valor previsto

$ y_ {t} $ é o valor real, e

n é o número total de valores no conjunto de teste.

Está no poder da unidade e, portanto, é mais interpretável em comparação com MSE. O RMSE também penaliza mais por erros maiores. Usamos a métrica RMSE em nosso tutorial.

Erro Médio Absoluto

É a média da diferença absoluta entre os valores previstos e os valores reais. Tem as mesmas unidades que o valor previsto e verdadeiro e é sempre positivo.

$$ MAE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ {t = n} | y '{t} -y_ {t} \ lvert $$

Onde, $ y '_ {t} $ é o valor previsto,

$ y_ {t} $ é o valor real, e

n é o número total de valores no conjunto de teste.

Erro de porcentagem média

É a porcentagem da média da diferença absoluta entre os valores previstos e os valores reais, dividida pelo valor verdadeiro.

$$ MAPE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ frac {y '_ {t} -y_ {t}} {y_ {t}} * 100 \: \% $$

Onde, $ y '_ {t} $ é o valor previsto,

$ y_ {t} $ é o valor real en é o número total de valores no conjunto de teste.

No entanto, a desvantagem de usar esse erro é que o erro positivo e o negativo podem compensar um ao outro. Portanto, é usado o erro percentual médio absoluto.

Erro de porcentagem média absoluta

É a porcentagem da média da diferença absoluta entre os valores previstos e os valores reais, dividida pelo valor verdadeiro.

$$ MAPE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ frac {| y '_ {t} -y_ {t} \ lvert} {y_ {t}} * 100 \: \% $$

Onde $ y '_ {t} $ é o valor previsto

$ y_ {t} $ é o valor real, e

n é o número total de valores no conjunto de teste.