Python - P-Value

O valor p é sobre a força de uma hipótese. Construímos hipóteses com base em algum modelo estatístico e comparamos a validade do modelo usando o valor p. Uma maneira de obter o valor p é usando o teste t.

Este é um teste bilateral para a hipótese nula de que o valor esperado (média) de uma amostra de observações independentes 'a' é igual à média da população dada, popmean. Vamos considerar o seguinte exemplo.

from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)

O programa acima irá gerar a seguinte saída.

Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))

Comparando duas amostras

Nos exemplos a seguir, existem duas amostras, que podem vir da mesma distribuição ou de uma distribuição diferente, e queremos testar se essas amostras têm as mesmas propriedades estatísticas.

ttest_ind- Calcula o teste T para as médias de duas amostras independentes de pontuação. Este é um teste bilateral para a hipótese nula de que duas amostras independentes têm valores médios (esperados) idênticos. Este teste assume que as populações têm variações idênticas por padrão.

Podemos usar este teste, se observarmos duas amostras independentes da mesma população ou de populações diferentes. Vamos considerar o seguinte exemplo.

from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)

O programa acima irá gerar a seguinte saída.

Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)

Você pode testar o mesmo com uma nova matriz do mesmo comprimento, mas com uma média variada. Use um valor diferente emloc e teste o mesmo.