Graus de liberdade
Os graus de liberdade são a combinação do número de observações em um conjunto de dados que variam de forma aleatória e independente menos as observações que são restritas a esses valores arbitrários.
Em outras palavras, os graus de liberdade são o número de observações puramente livres (que podem variar) quando estimamos os parâmetros.
Diferenciamos principalmente entre estatísticas que usam parâmetros populacionais e amostrais para determinar seus graus de liberdade. Comentamos as diferenças entre a média e o desvio padrão quando os parâmetros são população ou amostra:
Parâmetros de população e amostra
- Parâmetros populacionais:
Como nas populações não conhecemos todos os valores, os graus de liberdade serão todos os elementos da população: N.
Ambas as estatísticas permitem que todas as observações do conjunto sejam aleatórias e, portanto, cada vez que estimarmos a estatística obteremos resultados diferentes. Então, as observações que têm pleno direito de variar são todas as observações do conjunto populacional. Em outras palavras, os graus de liberdade neste caso são todos os elementos da população: N. Por esta razão, dividimos ambas as estatísticas pelo tamanho total da população (N).
- Parâmetros de amostra (estimativas):
Nas amostras conhecemos todos os valores.
Diferenciamos o tamanho da população (N) com o tamanho da amostra (n).
Como conhecemos todos os valores nas amostras, não temos problemas em calcular a média, pois permite que todas as observações do conjunto sejam aleatórias.
No caso do desvio padrão, impomos uma restrição aos graus de liberdade: todos os elementos da amostra (n) e subtraímos 1 elemento.
Mas… Por que subtraímos apenas 1 e não 5 ou 10 elementos da amostra (n) ?
Quanto mais elementos subtrairmos, mais informações teremos sobre o parâmetro da amostra, neste caso, o desvio padrão.
Quanto mais informações tivermos, menos liberdade (graus de liberdade) as observações da amostra terão para assumir valores aleatórios. Quanto mais elementos subtrairmos da amostra, mais limitações impomos e menos graus de liberdade o parâmetro da amostra terá.
Exemplo
Supomos que vamos a Andorra para ver as Finais do Campeonato do Mundo de Esqui porque gostamos muito de esqui alpino. Trazemos um mapa que nos diz onde estão localizadas as diferentes disciplinas e o nome de alguns dos competidores, mas o número de partida de cada participante não é especificado. Toda vez que eles dizem o nome do concorrente, riscamos o nome dele. Como a lista de concorrentes é limitada, chegará um ponto em que saberemos o nome do concorrente antes de serem anunciados pelos alto-falantes.
Analisamos a crônica do ponto de vista matemático:
- Tamanho da amostra (n) porque apenas nos informam o nome de alguns dos participantes.
- Cada participante pode sair aleatoriamente, a ordem não importa e não pode competir novamente (combinações sem repetições).
- O último participante será o elemento conhecido (n-1). Assim, todos os outros participantes podem sair aleatoriamente, exceto o último, que sabemos com certeza.
Leia o exemplo de graus de liberdade