Uma das grandes contribuições da estatística para ampliar o entendimento humano sobre os fenômenos observados é a capacidade de medir a relação entre diferentes variáveis. Os coeficientes de correlação auxiliam os pesquisadores a mensurar essa relação.

Pensando nisso, elaboramos este artigo para mostrar os principais coeficientes de correlação e quando cada um deles deve ser utilizado.

O que são coeficientes de correlação?

Os coeficientes de correlação são métodos estatísticos para se medir as relações entre variáveis e o que elas representam.

O que a correlação procura entender é como uma variável se comporta em um cenário onde outra está variando, visando identificar se existe alguma relação entre a variabilidade de ambas. Embora não implique em causalidade, o coeficiente de correlação exprime em números essa relação, ou seja, quantifica a relação entre as variáveis.

Variância

Em pesquisas científicas os coeficientes de correlação são muito importantes para se traçar panoramas em estudos com muitas variáveis relacionadas, pois assim é possível entender como a variabilidade de uma afeta a outra.

Mas não existe apenas uma forma de se calcular a correlação entre variáveis. Dependendo da forma e de como se comportam as variáveis, um coeficiente de correlação é mais adequado que outro.  

Coeficiente de Correlação de Pearson

O coeficiente de correlação de Pearson (r), também chamado de correlação linear ou r de Pearson, é um grau de relação entre duas variáveis quantitativas e exprime o grau de correlação através de valores situados entre -1 e 1.

Quando  o coeficiente de correlação se aproxima de 1, nota-se um aumento no valor de uma variável quando a outra também aumenta, ou seja, há uma relação linear positiva. Quando o coeficiente se aproxima de -1, também é possível dizer que as variáveis são correlacionadas, mas nesse caso quando o valor de uma variável aumenta o da outra diminui. Isso é o que é chamado de correlação negativa ou inversa.

Um coeficiente de correlação próximo de zero indica que não há relação entre as duas variáveis, e quanto mais eles se aproximam de 1 ou  -1, mais forte é a relação.

coeficiente de correlação

Coeficiente de Correlação de Spearman

Denominado pela letra grega rho (ρ), o coeficiente de correlação de postos de Spearman é uma medida de correlação não paramétrica também avaliado no intervalo entre -1 e 1.

Ao contrário do coeficiente de Pearson, o coeficiente de Spearman não exige a suposição de que a relação entre as variáveis seja linear, nem requer que as mesmas sejam quantitativas – pode inclusive ser utilizado para verificar relação entre variáveis medidas no nível ordinal.

Coeficiente de Correlação de Kendall

Expresso pela letra grega tau (τ), o coeficiente de correlação de Kendall é uma medida de associação para variáveis ordinais. Uma vantagem de tau sobre o coeficiente de Spearman é a possibilidade de ser generalizado para um coeficiente de correlação parcial.

Aplicação dos coeficientes de correlação: tempo de estudo X notas nas provas

Pensemos em uma situação hipotética. Um professor percebe que alguns de seus alunos não estão apresentando bom desempenho nas provas e, percebendo que estes não estavam dedicando tempo suficiente aos estudos, decide fazer uma pequena experiência com a turma.

Ele então pede que os alunos informem o tempo que cada um dedicou em casa ao estudo do conteúdo cobrado e monta a seguinte tabela:

AlunoHoras de EstudoNota
1209,5
2122,5
3143,6
4156,7
5185,2
691
750
841,5
982
10133
11143,5
12154,5
13198,5
14187,5
15125
16114
17103
18155
19176,5
202010

Ele explica aos alunos que se existe uma relação entre as horas de estudo com as notas da prova, isso poderia facilmente ser observado em um gráfico. Utilizando o eixo X para as horas de estudo e o eixo Y para a nota na prova, marca no gráfico a nota e o tempo de estudo de cada aluno.

Coeficientes de correlação: quantificando a relação entre variáveis

Visualmente parece haver alguma relação do tempo de estudo e a nota da prova, pois quanto maior o tempo de estudo, maior tende a ser a nota do aluno. Mas como confirmar e quantificar essa relação?

Além de calcular o coeficiente de correlação, existem testes estatísticos que permitem avaliar as hipóteses de que o coeficiente é igual a zero (hipótese nula) e de que ele é diferente de zero (hipótese alternativa).

O professor então decide utilizar o coeficiente de correlação de Pearson e chegou ao valor de r = 0,903, com p-valor de 0,000.

Interpretando os resultados do coeficiente de correlação

Ora, se o coeficiente de correlação de Pearson sustenta resultados entre -1 e 1, sendo que quanto mais próximo de -1, maior a correlação negativa entre as variáveis, e quanto mais próximo de 1, maior a correlação positiva, podemos dizer que nesse caso existe uma relação positiva entre horas de estudo e a nota da prova, como era de se esperar.

Além disso, o p-valor do teste de Pearson de 0,000 indica a rejeição da hipótese de que o coeficiente de correlação seja igual a zero, indicando que existe uma relação significativa entre as variáveis testadas.

Após apresentar evidências de que quanto mais um aluno estude em casa, maior tende a ser sua nota na prova, o professor espera que os alunos se dediquem mais aos estudos!

Correlação significativa implica em relação de causalidade?

Os coeficientes de correlação podem ser utilizados para identificar e medir a relação presentes em variáveis de nosso cotidiano, como a taxa de desemprego e o índice de criminalidade, a poluição no ar com problemas respiratórios, etc.

Os coeficientes de correlação são muito importantes na evolução do conhecimento humano e muito dos avanços científicos que tanto beneficiam nossas vidas, utilizaram desse conceito em seu desenvolvimento. Mas será que o fato de duas variáveis estarem correlacionadas, essa relação implica em causalidade? Ou seja, uma correlação significativa implica em uma relação de causa e efeito entre as variáveis? A resposta é NÃO.

Abordaremos causalidade e correlação em nossos futuros artigos. Então não deixe de acompanhar o nosso Blog. Caso tenha alguma dúvida sobre os coeficientes de correlação, não deixe de entrar em contato com nossos Data Talkers.

0 respostas

Deixe uma resposta

Quer participar dessa discussão?
Sinta-se livre para contribuir!

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *