variação
A variância é uma medida de dispersão que representa a variabilidade de uma série de dados em relação à sua média. Formalmente é calculado como a soma dos resíduos quadrados dividido pelo número total de observações.
Também pode ser calculado como o desvio padrão quadrado. Aliás, entendemos residual como a diferença entre o valor de uma variável em um determinado momento e o valor médio de toda a variável.
Antes de olhar para a fórmula de variância, devemos dizer que a variância nas estatísticas é muito importante. Uma vez que embora seja uma medida simples, ela pode fornecer muitas informações sobre uma variável específica.
Fórmula para calcular a variância
A unidade de medida da variância será sempre a unidade de medida correspondente aos dados mas ao quadrado. A variância é sempre maior ou igual a zero. Quando os resíduos são elevados ao quadrado, é matematicamente impossível que a variância seja negativa. E, portanto, não pode ser menor que zero.
Onde
- X: variável na qual a variância deve ser calculada
- x i : número de observação i da variável X. posso tomar valores entre 1 e n.
- n: número de observações.
- x̄ : É a média da variável X.
Ou o que é o mesmo:
Por que os resíduos são quadrados?
A razão pela qual os resíduos são elevados ao quadrado é simples. Se não fossem elevados ao quadrado, a soma dos resíduos seria zero. É uma propriedade dos resíduos. Assim, para evitar isso, como ocorre com o desvio padrão, eles são elevados ao quadrado. O resultado é a unidade de medida na qual os dados são medidos, mas ao quadrado.
Por exemplo, se tivéssemos dados sobre os salários de um grupo de pessoas em euros, os dados que dão a variação seriam em euros quadrados. Para que a interpretação faça sentido, calcularíamos o desvio padrão e converteríamos os dados para euros.
- Desvio -> (2-3) = -1
- Desvio -> (4-3) = 1
- Desvio -> (2-3) = -1
- Desvio -> (4-3) = 1
- Desvio -> (2-3) = -1
- Desvio -> (4-3) = 1
Se somarmos todos os desvios, o resultado é zero.
Qual é a diferença entre variância e desvio padrão?
Uma questão que poderia ser levantada, e com razão, seria a diferença entre variância e desvio padrão. Na verdade, eles vêm para medir a mesma coisa. A variância é o desvio padrão ao quadrado. Ou vice-versa, o desvio padrão é a raiz quadrada da variância.
O desvio padrão é feito para poder trabalhar nas unidades de medida iniciais. Claro, como é normal, pode-se perguntar, qual é a utilidade de ter variância como um conceito? Bem, embora a interpretação do valor que ele retorna não nos dê muita informação, seu cálculo é necessário para obter o valor de outros parâmetros.
Para calcular a covariância precisamos da variância e não do desvio padrão, para calcular algumas matrizes econométricas utiliza-se a variância e não o desvio padrão. É uma questão de conforto ao trabalhar com os dados de acordo com quais cálculos.
Exemplo de cálculo de variação
Vamos cunhar uma série de dados sobre os salários. Temos cinco pessoas, cada uma com um salário diferente:
João: 1.500 euros
Pepe: 1.200 euros
José: 1.700 euros
Miguel: 1.300 euros
Mateus: 1.800 euros
O salário médio, que precisamos para o nosso cálculo, é ((1.500 + 1.200 + 1.700 + 1.300 + 1.800)/5) 1.500 euros.
Uma vez que a fórmula de variância em sua forma desagregada é formulada da seguinte forma:
Obteremos que deve ser calculado de tal forma que:
O resultado é 52.000 euros ao quadrado. É importante lembrar que sempre que calculamos a variância temos as unidades de medida ao quadrado. Para convertê-lo para euros, neste caso teríamos que realizar o desvio padrão. O resultado aproximado seria de 228 euros. Isto significa que, em média, a diferença entre os salários das diferentes pessoas será de 228 euros.