Erros de especificação Definição, o que é e conceito
Os erros de especificação de um modelo econométrico referem-se aos diferentes erros que podem ser cometidos ao selecionar e tratar um conjunto de variáveis independentes para explicar uma variável dependente.
Quando um modelo é construído, ele deve atender à suposição de especificação correta. Isso se baseia no fato de que as variáveis explicativas selecionadas para o modelo são aquelas capazes de explicar a variável independente. Portanto, assume-se que não existe uma variável independente (x) que possa explicar a variável independente (y) e que desta forma teriam sido escolhidas as variáveis que permitem propor o modelo correto.
Erros de especificação do modelo
Há uma série de erros na especificação do modelo que podem ser agrupados em três grandes grupos:
Grupo 1: A forma como funciona não está especificada corretamente
- Omissão de variáveis relevantes: Vamos imaginar que queremos explicar o retorno das ações da empresa Y. Para isso, selecionamos PER, capitalização de mercado e valor contábil como variáveis independentes. Se o free float estiver correlacionado com alguma das variáveis contidas no modelo, o erro do nosso modelo estaria correlacionado com as variáveis incluídas no modelo. Isso faria com que os parâmetros estimados pelo modelo fossem imparciais e inconsistentes. Com isso, os resultados das previsões e os diferentes testes realizados no modelo não seriam válidos.
- Variáveis a serem transformadas: A hipótese do modelo de regressão assume que a variável dependente está linearmente relacionada às variáveis independentes. No entanto, em muitas ocasiões a relação entre estes não é linear. Se a transformação necessária não for feita na variável independente, o modelo não terá o ajuste correto. Como exemplos de transformação de variáveis independentes temos a tomada de logaritmos, a raiz quadrada ou quadrada entre outros.
- Coleta deficiente de dados de amostra:Os dados das variáveis independentes devem ser consistentes ao longo do tempo, ou seja, não pode haver mudanças estruturais nas variáveis independentes. Imaginemos que queremos explicar a variação do PIB no país X usando consumo e investimento como variáveis independentes. Suponha que um campo de petróleo seja descoberto naquele país em terras estatais e o governo decida abolir os impostos. Isso poderia significar uma mudança nos hábitos de consumo do país que a partir dessa data seriam mantidos indefinidamente ao longo do tempo. Neste caso devemos coletar duas séries temporais diferentes e estimar dois modelos. Um modelo antes da mudança e outro depois. Se fôssemos reunir os dados em uma única amostra e estimar um modelo, teríamos um modelo mal especificado e as hipóteses,
Grupo 2: As variáveis independentes são correlacionadas com o termo de erro na série temporal
- Usando a variável dependente com defasagem como variável independente: Usar uma variável com defasagem é usar os dados dessa mesma variável, mas medidos em um período anterior. Suponha que estamos usando o modelo de PIB acima como a variável dependente. Acrescentemos ao modelo, além do consumo e do investimento, o PIB do ano anterior (PIB t-1 ). Se o PIB do ano anterior for correlacionado serialmente com o erro, os coeficientes estimados seriam tendenciosos e não inconsistentes. Isso novamente invalidaria todos os testes de hipóteses, previsões etc.
- Prever o passado: Quando medimos uma variável, sempre temos que pegar o período anterior ao que queremos estimar. Suponha que nossa variável dependente seja o retorno da ação X e nossa variável independente seja o PER. Suponhamos também que estamos pegando os dados finais de fevereiro. Se usarmos isso em nosso modelo, concluiremos que a ação com maior P/L no final de fevereiro foi a de maior retorno no final de fevereiro. A correta especificação do modelo supõe tomar os dados do início do período para prever os dados posteriores e não o contrário como no caso anterior. Isso se chama prever o passado.
- Medindo a variável independente com erro: Suponha que nossa variável independente seja o retorno de uma ação e uma de nossas variáveis independentes seja a taxa de juros nominal. Lembre-se de que a taxa de juros nominal é a taxa de juros mais a inflação. Como o componente da taxa nominal de juros não é observável no futuro, estaríamos medindo a variável com erro. Para medir corretamente a taxa de juros, teríamos que usar a taxa de juros esperada e que esta levasse em consideração a inflação esperada e não a atual.