Propriedades da distribuição t de Student
Neste post explicamos as propriedades da distribuição t de Student.
Em outras palavras, a distribuição t é uma distribuição de probabilidade que estima o valor da média de uma pequena amostra retirada de uma população que segue uma distribuição normal cujo desvio padrão não conhecemos.
Artigos recomendados: graus de liberdade, graus de liberdade (exemplo) e distribuição normal.
História
William Sealy Gosset (1876-1937) em 1908 teve a necessidade de criar uma distribuição que o ajudasse com cálculos estatísticos sobre as cervejas da marca Guinness na Irlanda. Como, para demonstrar a aplicabilidade de sua nova distribuição, os resultados tiveram que ser publicados com dados privados da cervejaria, a empresa proibiu seus funcionários de divulgar informações confidenciais. Essa limitação não impediu Gosset de publicar sua descoberta sob o pseudônimo de Student . A partir desse momento, a distribuição t é reconhecida como distribuição t de Student.
Propriedades da distribuição t de Student
As propriedades da distribuição t de Student são as seguintes:
- É uma distribuição simétrica. O valor da média, da mediana e da moda coincidem. Matematicamente,
- É uma distribuição unimodal. Os valores que são mais frequentes ou mais prováveis de aparecer (moda) estão em torno da média. Quando nos afastamos da média, a probabilidade de aparecimento dos valores e sua frequência diminuem.
- Se tivermos uma amostra de tamanho n, teremos uma distribuição t com (n-1) graus de liberdade.
Em outras palavras, a distribuição terá o mesmo número de observações em ambos os lados do valor central.
- A função densidade não depende dos graus de liberdade para ser simétrica.
- A representação gráfica assemelha-se à distribuição normal, ou seja, também é em forma de sino.
- O valor médio ou central é zero (0).
- Quanto mais os graus de liberdade aumentam, mais semelhante a distribuição t será à distribuição normal.
Distribuição normal vs distribuição t
A distribuição t e a distribuição normal diferem principalmente porque a distribuição t atribui mais probabilidade a observações discrepantes do que a distribuição normal padrão (variância maior que 1). Em outras palavras, a distribuição t tem caudas mais largas do que a distribuição normal.