Definição estatística suficiente, o que é e conceito
Uma estatística suficiente para um parâmetro Θ é aquela capaz de coletar ou resumir todas as informações que a amostra de uma variável aleatória X contém.
Sabemos que uma estatística é uma função real da amostra. Ou seja, leva valores reais contidos na amostra. A partir daí, como vimos no artigo em que se define o conceito de estatística, devemos garantir que a estatística tenha certas propriedades. Por que exigir tais propriedades? Para garantir que a estatística seja útil para nossos propósitos.
A suficiência é uma dessas propriedades. De uma forma muito mais simples, diremos que uma estatística é suficiente se utilizar toda a informação contida na amostra.
Como saber se uma estatística é suficiente?
Logicamente, a pergunta que surge é: Como posso saber se uma estatística T satisfaz a propriedade de suficiência? Ou, como posso encontrar, caso exista, uma estatística que satisfaça a propriedade de suficiência. A resposta a essas duas perguntas é encontrada em dois teoremas:
- Critério de fatoração de Fisher-Neyman: Este critério afirma que dada uma estatística T, se ela atender a certas condições, então será uma estatística suficiente.
- Teorema de Darmois: Este teorema responde à segunda questão. Ou seja, permite-nos encontrar uma estatística suficiente através de uma série de procedimentos.
Exemplo de estatística suficiente
Suponha que queremos calcular a renda média anual das famílias que residem no Chile. Para isso, seguiremos o seguinte processo:
- Coletar informações (amostra): Como não podemos perguntar a cada uma das famílias que residem no Chile quanto ganham anualmente, tomaremos uma amostra representativa de, por exemplo, 1.000 famílias.
- Identifique a variável aleatória em estudo: A variável aleatória em estudo é a renda familiar. Então: X → Renda Familiar
- Escolhendo a estatística certa: A estatística certa para calcular a renda média não é outra senão a expectativa de X. Em outras palavras, a média amostral de X.
- Como posso saber se a estatística média da amostra é uma estatística suficiente? Como já temos a expressão matemática da estatística, usaremos o critério de fatoração de Fisher-Neyman. Ou, Teorema de Darmois. São fórmulas criadas para esse fim.
Após a aplicação dos devidos cálculos, concluímos que a estatística média amostral atende ao requisito ou propriedade de suficiência. Ao garantir que este requisito seja cumprido, estamos a garantir que esta função (estatística) que permite sintetizar a informação (renda média) utiliza toda a informação contida na amostra (as 1.000 famílias).
Por que é importante que eu use todas as informações contidas na amostra?
Agora que sabemos que a média amostral é uma estatística suficiente, vamos considerar um caso. Que sentido faria querer calcular a renda média com base nessas 1.000 famílias chilenas e usar apenas os dados de 500 famílias?
Claro, isso não faria nenhum sentido. Queremos um resumo de todas as informações. Ou seja, o que definimos como estatística suficiente.