Distribuição normal
A distribuição normal é um modelo teórico capaz de aproximar satisfatoriamente o valor de uma variável aleatória a uma situação ideal.
Em outras palavras, a distribuição normal ajusta uma variável aleatória a uma função que depende da média e do desvio padrão. Ou seja, a função e a variável aleatória terão a mesma representação, mas com pequenas diferenças.
Uma variável aleatória contínua pode receber qualquer número real. Por exemplo, retornos de ações, resultados de testes, QI e erros padrão são variáveis aleatórias contínuas.
Uma variável aleatória discreta assume valores naturais. Por exemplo, o número de alunos em uma universidade.
A distribuição normal é a base para outras distribuições, como distribuição t de Student, distribuição qui-quadrado, distribuição F de Fisher e outras distribuições.
Fórmula de distribuição normal
Dada uma variável aleatória X, dizemos que a frequência de suas observações pode se aproximar satisfatoriamente de uma distribuição normal tal que:
Onde os parâmetros da distribuição são a média ou valor central e o desvio padrão:
Em outras palavras, estamos dizendo que a frequência de uma variável aleatória X pode ser representada por uma distribuição normal.
Representação
Função densidade de probabilidade de uma variável aleatória que segue uma distribuição normal.
Propriedades
- É uma distribuição simétrica. O valor da média, da mediana e da moda coincidem. Matematicamente,
Média = Mediana = Moda
- Distribuição unimodal. Os valores que são mais frequentes ou mais propensos a aparecer estão em torno da média. Em outras palavras, quando nos afastamos da média, a probabilidade de aparecimento dos valores e sua frequência diminuem.
O que precisamos para representar uma distribuição normal?
- Uma variável aleatória.
- Calcule a média.
- Calcule o desvio padrão.
- Decida a função que queremos representar: função de densidade de probabilidade ou função de distribuição.
exemplo teórico
Suponha que queremos saber se os resultados de um teste podem ser satisfatoriamente aproximados a uma distribuição normal.
Sabemos que 476 alunos participam deste teste e que os resultados podem variar de 0 a 10. Calculamos a média e o desvio padrão das observações (resultados do teste).
Assim, definimos a variável aleatória X como sendo os resultados do teste que dependem de cada resultado individual. Matematicamente,
O resultado de cada aluno é registrado em uma tabela. Desta forma, obteremos uma visão global dos resultados e sua frequência.
Resultados | Frequência |
0 | vinte |
1 | 31 |
dois | 44 |
3 | 56 |
4 | 64 |
5 | 66 |
6 | 62 |
7 | 51 |
8 | 39 |
9 | 26 |
10 | 16 |
TOTAL | 475 |
Feita a tabela, representamos os resultados do teste e as frequências. Se o gráfico se parece com a imagem anterior e atende às propriedades, a variável de resultados do teste pode aproximar satisfatoriamente uma distribuição normal com média de 4,86 e desvio padrão de 2,56.
Os resultados do teste podem se aproximar de uma distribuição normal?
Razões para considerar que a variável de resultados do teste segue uma distribuição normal:
- Distribuição simétrica. Ou seja, há o mesmo número de observações tanto à direita quanto à esquerda do valor central. Além disso, que a média, a mediana e a moda têm o mesmo valor.
Média = Mediana = Moda = 5
- As observações com maior frequência ou probabilidade estão em torno do valor central. Em outras palavras, as observações com menor frequência ou probabilidade estão longe do valor central.
A distribuição normal descreve a variável aleatória por uma aproximação que produz erros padrão (as barras acima de cada coluna). Esses erros são a diferença entre as observações reais (resultados) e a função densidade (distribuição normal).