A correlação se refere a algumas relações estatísticas envolvendo dependência entre dois conjuntos de dados. Exemplos simples de fenômenos dependentes incluem a correlação entre a aparência física dos pais e de seus filhos e a correlação entre o preço de um produto e sua quantidade fornecida.
Pegamos o exemplo do conjunto de dados iris disponível na biblioteca python seaborn. Nele tentamos estabelecer a correlação entre o comprimento e a largura das sépalas e pétalas de três espécies de flor de íris. Com base na correlação encontrada, um modelo forte poderia ser criado, o que distingue facilmente uma espécie de outra.
import matplotlib.pyplot as plt
import seaborn as sns
df = sns.load_dataset('iris')
#without regression
sns.pairplot(df, kind="scatter")
plt.show()
Está output é o seguinte -