Coeficiente de variação
O coeficiente de variação, também conhecido como coeficiente de variação de Pearson, é uma medida estatística que nos informa sobre a dispersão relativa de um conjunto de dados.
Em outras palavras, ela nos informa, como outras medidas de dispersão, se uma variável se move muito, pouco, mais ou menos que outra.
Fórmula do coeficiente de variação
Seu cálculo é obtido dividindo-se o desvio padrão entre o valor absoluto da média do conjunto e geralmente é expresso em porcentagem para melhor compreensão.
- X: variável na qual a variância deve ser calculada
- S x : Desvio padrão da variável X.
- | x̄ |: É a média da variável X em valor absoluto com x̄ ≠ 0
O coeficiente de variação pode ser visto expresso com as letras CV ou, dependendo do manual ou da fonte utilizada. Sua fórmula é a seguinte:
O coeficiente de variação é usado para comparar conjuntos de dados pertencentes a diferentes populações. Se observarmos sua fórmula, veremos que ela leva em consideração o valor da média. Portanto, o coeficiente de variação nos permite ter uma medida de dispersão que elimina as possíveis distorções das médias de duas ou mais populações.
Exemplos de uso do coeficiente de variação em vez do desvio padrão
Aqui estão alguns exemplos dessa medida de dispersão:
Comparação de conjuntos de dados de dimensão diferente
Queremos comparar a diferença entre a altura de 50 alunos em uma classe e seu peso. Para comparar a altura, poderíamos usar metros e centímetros como unidade de medida e quilogramas para peso. Comparar essas duas distribuições usando o desvio padrão não faria sentido, pois se destina a medir duas variáveis quantitativas diferentes (uma medida de comprimento e outra de massa).
Comparar conjuntos com grande diferença entre médias
Imagine, por exemplo, que queremos medir o peso de besouros e hipopótamos. O peso dos besouros é medido em gramas ou miligramas e o peso dos hipopótamos é geralmente medido em toneladas. Se para nossa medição convertermos o peso dos besouros para toneladas de modo que ambas as populações estejam na mesma escala, usar o desvio padrão como medida de dispersão não seria apropriado. O peso médio dos besouros medido em toneladas seria tão pequeno que, se usarmos o desvio padrão, dificilmente haveria dispersão nos dados. Isso seria um erro, pois o peso entre as diferentes espécies de besouros pode variar consideravelmente.
Exemplo de cálculo do coeficiente de variação
Considere uma população de elefantes e outra de camundongos. A população de elefantes tem um peso médio de 5.000 kg e um desvio padrão de 400 kg. A população de camundongos tem um peso médio de 15 gramas e um desvio padrão de 5 gramas. Se compararmos a dispersão de ambas as populações por meio do desvio padrão, poderíamos pensar que há uma dispersão maior para a população de elefantes do que para a de camundongos.
No entanto, ao calcular o coeficiente de variação para ambas as populações, perceberíamos que é exatamente o contrário.
Elefantes: 400/5000=0,08
Ratos: 5/15=0,33
Se multiplicarmos ambos os dados por 100, temos que o coeficiente de variação para elefantes é de apenas 8%, enquanto o de camundongos é de 33%. Como consequência da diferença entre as populações e seu peso médio, vemos que a população com maior dispersão não é aquela com maior desvio padrão.