Medidas de dispersão
As medidas de dispersão tentam, através do cálculo de diferentes fórmulas, produzir um valor numérico que ofereça informação sobre o grau de variabilidade de uma variável.
Em outras palavras, medidas de dispersão são números que indicam se uma variável se move muito, pouco, mais ou menos que outra. A razão de ser deste tipo de medição é conhecer de forma resumida uma característica da variável estudada. Nesse sentido, devem acompanhar as medidas de tendência central. Juntos, eles fornecem informações rápidas que podemos usar para comparar e, se necessário, tomar decisões.
Principais medidas de dispersão
As medidas de dispersão mais conhecidas são: a amplitude, a variância, o desvio padrão e o coeficiente de variação (não confundir com o coeficiente de determinação). A seguir veremos essas quatro medidas.
Alcance
O intervalo é um valor numérico que indica a diferença entre o valor máximo e o valor mínimo de uma população ou amostra estatística. Sua fórmula é:
R = Máx x – Mínimo x
Onde:
- R → é o intervalo.
- Max → É o valor máximo da amostra ou população.
- Min → É o valor mínimo da amostra ou população estatística.
- x → É a variável sobre a qual esta medida deve ser calculada.
variação
A variância é uma medida de dispersão que representa a variabilidade de uma série de dados em relação à sua média. Formalmente é calculado como a soma dos resíduos quadrados dividido pelo número total de observações. Sua fórmula é a seguinte:
- X → Variável na qual a variância deve ser calculada
- x i → Número de observação i da variável X. posso assumir valores entre 1 e n.
- N → Número de observações.
- x̄ → É a média da variável X.
Desvio típico
O desvio padrão é outra medida que fornece informações sobre a dispersão em relação à média. Seu cálculo é exatamente o mesmo que a variância, mas tirando a raiz quadrada de seu resultado. Ou seja, o desvio padrão é a raiz quadrada da variância.
- X → Variável na qual a variância deve ser calculada
- x i → Número de observação i da variável X. posso assumir valores entre 1 e n.
- N → Número de observações.
- x̄ → É a média da variável X.
Coeficiente de variação
Seu cálculo é obtido dividindo-se o desvio padrão entre o valor absoluto da média do conjunto e geralmente é expresso em porcentagem para melhor compreensão.
- X → Variável na qual a variância deve ser calculada
- σ x → Desvio padrão da variável X.
- | x̄ | → É a média da variável X em valor absoluto com x̄ ≠ 0
Abaixo está uma imagem que resume as fórmulas acima:
Para fins comparativos, é importante indicar que devemos sempre comparar variáveis com as mesmas unidades de medida. Por exemplo, não faria muito sentido dizer que a variabilidade do produto interno bruto (PIB) é maior do que a da venda de sorvete. Por procuração, pode ser indicado, mas comparar euros com número de sorvetes não faz sentido. Portanto, é sempre melhor comparar variáveis com a mesma unidade de medida.
O mesmo vale para medidas de dispersão. Se o que você quer é comparar duas variáveis, é preferível fazê-lo com as mesmas medidas de dispersão para cada uma delas e de preferência na mesma unidade.