Modelo Autoregressivo Distribuído com Desfasamento (ADR) (II)
O Autoregressive Distributed Lag Model (ADR) é uma regressão envolvendo uma nova variável independente defasada além da variável dependente defasada.
Em outras palavras, o modelo ADR é uma extensão do modelo autoregressivo de ordem p, AR(p), que inclui outra variável independente em um período de tempo anterior ao período da variável dependente.
Exemplo
Com base nos dados de 1995 a 2018, calculamos os logaritmos naturais dos passes de esqui para cada ano e retrocedemos um período para as variáveis passes de esqui t e pistas t :
Ano |
Passes de esqui ( € ) |
ln_t |
ln_t-1 |
Faixas_t |
Faixas_t-1 |
Ano |
Passes de esqui ( € ) |
ln_t |
ln_t-1 |
Faixas_t |
Faixas_t-1 |
novecentos e noventa e cinco |
32 |
3,4657 |
8 |
2007 |
88 |
4.4773 |
4,3820 |
6 |
9 |
||
mil novecentos e noventa e seis |
44 |
3,7842 |
3,4657 |
6 |
8 |
2008 |
40 |
3,6889 |
4.4773 |
5 |
6 |
1997 |
cinquenta |
3,9120 |
3,7842 |
6 |
6 |
2009 |
68 |
4.2195 |
3,6889 |
6 |
5 |
1998 |
55 |
4,0073 |
3,9120 |
5 |
6 |
2010 |
63 |
4,1431 |
4.2195 |
10 |
6 |
1999 |
40 |
3,6889 |
4,0073 |
5 |
5 |
2011 |
69 |
4,2341 |
4,1431 |
6 |
10 |
2000 |
32 |
3,4657 |
3,6889 |
5 |
5 |
2012 |
72 |
4,2767 |
4,2341 |
8 |
6 |
2001 |
3. 4 |
3,5264 |
3,4657 |
8 |
5 |
2013 |
75 |
4,3175 |
4,2767 |
8 |
8 |
2002 |
60 |
4,0943 |
3,5264 |
5 |
8 |
2014 |
71 |
4,2627 |
4,3175 |
5 |
8 |
2003 |
63 |
4,1431 |
4,0943 |
6 |
5 |
2015 |
73 |
4.2905 |
4,2627 |
9 |
5 |
2004 |
64 |
4.1589 |
4,1431 |
6 |
6 |
2016 |
63 |
4,1431 |
4.2905 |
10 |
9 |
2005 |
78 |
4,3567 |
4.1589 |
5 |
6 |
2017 |
67 |
4,2047 |
4,1431 |
8 |
10 |
2006 |
80 |
4,3820 |
4,3567 |
9 |
5 |
2018 |
68 |
4.2195 | 4,2047 |
6 | 8 |
2019 |
? |
? |
4.2195 |
6 |
Para fazer a regressão, usamos os valores de ln_t como variável dependente e os valores de ln_t-1 e tracks_t-1 como variáveis independentes. Os valores em vermelho são deixados de fora da regressão.
Obtemos os coeficientes da regressão:
Neste caso, o sinal dos regressores é positivo:
- Um aumento de € 1 no preço dos passes de esqui na época anterior (t-1) traduz-se num aumento de € 0,48 no preço dos passes de esqui para esta época (t).
- Um aumento de uma pista preta aberta na temporada anterior (t-1) se traduz em um aumento de 4,1% no preço dos passes de esqui para esta temporada (t).
Os valores entre parênteses abaixo dos coeficientes são os erros padrão das estimativas.
Nós substituímos
Então,
Ano | Passes de esqui ( € ) | Faixas | Ano | Passes de esqui ( € ) | Faixas |
novecentos e noventa e cinco | 32 | 8 | 2007 | 88 | 6 |
mil novecentos e noventa e seis | 44 | 6 | 2008 | 40 | 5 |
1997 | cinquenta | 6 | 2009 | 68 | 6 |
1998 | 55 | 5 | 2010 | 63 | 10 |
1999 | 40 | 5 | 2011 | 69 | 6 |
2000 | 32 | 5 | 2012 | 72 | 8 |
2001 | 3. 4 | 8 | 2013 | 75 | 8 |
2002 | 60 | 5 | 2014 | 71 | 5 |
2003 | 63 | 6 | 2015 | 73 | 9 |
2004 | 64 | 6 | 2016 | 63 | 10 |
2005 | 78 | 5 | 2017 | 67 | 8 |
2006 | 80 | 9 | 2018 | 68 | 6 |
2019 | 63 |
ADR(p,q) vs. AR(p)
Qual modelo é mais adequado para prever os preços dos passes de esqui dadas as observações acima, AR(1) ou ADR(1,1)? Em outras palavras, a incorporação das faixas de variáveis independentes t-1 na regressão ajuda a ajustar melhor nossa previsão?
Observamos o R ao quadrado das regressões dos modelos:
Modelo AR(1): R2 = 0,33
Modelo ADR(1,1): R2 = 0,40
O R 2 do modelo ADR(1,1) é superior ao R 2 do modelo AR(1). Isso significa que a introdução das faixas de variáveis independentes t-1 na regressão ajuda a ajustar melhor nossa previsão.