Estatística descritiva
A estatística descritiva é uma disciplina responsável por coletar, armazenar, ordenar, fazer tabelas ou gráficos e calcular parâmetros básicos sobre o conjunto de dados.
A estatística descritiva é, juntamente com a inferência estatística ou estatística inferencial, um dos dois grandes ramos da estatística. Seu próprio nome o indica, ele tenta descrever algo. Mas não descrevê-lo de forma alguma, mas quantitativamente. Pense no peso de uma caixa de legumes, na altura de uma pessoa ou na quantidade de dinheiro que uma empresa ganha. Destas variáveis poderíamos dizer muitas coisas. Por exemplo, poderíamos indicar que esta ou aquela caixa de tomates pesa muito ou pesa menos que outras. Continuando com outro exemplo, poderíamos dizer que a renda de uma empresa varia muito ao longo do tempo ou que uma pessoa é de estatura média.
Para ditar as afirmações acima, sobre muito, pouco, alto, baixo, muito variável ou pouco variável, precisamos de variáveis de medição. Ou seja, precisamos quantificá-los, oferecer um número. Com isso em mente, poderíamos usar gramas ou quilogramas como unidade de medida para encontrar o peso de quantas caixas de tomates considerarmos. Assim que pesarmos trinta caixas, saberemos quais pesam mais, quais pesam menos, qual a quantidade mais repetida ou se há muita disparidade entre os pesos das diferentes caixas.
Com essa ideia nasceu a estatística descritiva, com a de coletar dados, armazená-los, fazer tabelas ou até gráficos que nos oferecem informações sobre determinado assunto. Além disso, eles nos oferecem medidas que resumem as informações de uma grande quantidade de dados.
Tipos de variáveis estatísticas
Dentro da estatística descritiva, podemos descrever os dados qualitativa ou quantitativamente.
- Variável qualitativa: Refere-se a uma qualidade. Exemplos: a cor dos olhos ou do cabelo de uma pessoa.
- Variável quantitativa: Refere-se a uma medida quantitativa. Exemplos: a altura de uma pessoa em centímetros ou o peso de uma pessoa em quilogramas.
Assim, sobre essas variáveis, certos parâmetros podem ser calculados. Principalmente nas variáveis quantitativas. Como, por exemplo, qual é o valor médio da cor dos olhos? Se houver cinco pessoas com a cor dos olhos azuis e cinco com a cor dos olhos verdes, a média não será que eles tenham uma cor média dos olhos azul-esverdeados. Portanto, nesse caso não seria possível calcular alguns dos parâmetros que veremos a seguir.
Parâmetros estatísticos básicos
Para resumir as informações, foram elaboradas várias fórmulas que ofereciam medidas de um determinado tipo. Assim, há aqueles que nos oferecem informações sobre o centro, outros sobre a dispersão ou variabilidade e outros sobre a posição de um valor.
- Medidas de tendência central: assim chamadas porque fornecem informações sobre o centro do conjunto de dados. Por exemplo, a média é uma medida de tendência ou posição central, pois a média nos dá um valor centralizado do conjunto de dados. Onde poderíamos dizer que o ponto médio está localizado? No centro, no meio aproximadamente. Outro exemplo de medida de tendência central é a mediana.
- Medidas de dispersão: Também são conhecidas como medidas de variabilidade. Por exemplo, o desvio padrão é uma medida de variabilidade, pois nos diz se os valores de um conjunto de dados são muito diferentes ou não. Mais dois exemplos de medidas de dispersão podem ser a variância e o intervalo estatístico.
- Medições de posição: Não são as mais conhecidas, mas são frequentemente utilizadas. Um exemplo disso é encontrado em percentis ou decis. Quando um dado específico está no percentil 90, significa que 90% dos dados estão abaixo desse dado. Existem outras medidas de posição como quartis ou algumas variantes como o primeiro quartil.
Distribuição de frequência
Também é interessante ver como as frequências são distribuídas. Para isso, existem alguns conceitos que devemos conhecer:
Frequência absoluta: É o número total de vezes que uma observação é repetida. Às vezes, as observações podem ser apresentadas em intervalos.
Frequência relativa: É o número em porcentagem que uma observação ou um conjunto delas se repete.
Frequência cumulativa: Pode ser cumulativa relativa ou cumulativa absoluta. Indica a quantidade acumulada até uma determinada observação.
Tabelas e gráficos em estatística descritiva
Embora as tabelas e gráficos não sejam exclusivos da estatística descritiva, eles a caracterizam. Em relatórios, estudos e pesquisas, o uso de gráficos é muito comum. Eles nos ajudam a exibir as informações de maneira mais simples e limitada.
Claro, dentro das tabelas e gráficos há um grande número de tipos. Aqui estão alguns exemplos de gráficos e tabelas usados com frequência.
- Histograma .
- Gráfico de barras .
- Gráfico de pizza .
- Tabelas de probabilidade .
- Tabelas Bidimensionais .
- Gráfico de caixa .
Exemplos de estatísticas descritivas
Um exemplo de estatística descritiva seria quando queremos calcular o número médio de gols por jogo de um jogador de futebol. Esta é uma estatística descritiva, pois estamos tentando descrever uma variável (número de gols). Nesse caso, calculando uma métrica.
Assim, dizer que Ronaldo marcou 1,05 golos por jogo durante os últimos 30 jogos é uma frase de estatística descritiva.
Poderíamos também dizer, por exemplo, que 30% dos colegas de Juan têm olhos azuis, 60% castanhos e os restantes 10% pretos. Seria uma variável qualitativa (cor dos olhos), mas estamos descrevendo a frequência com que ela aparece.