Exemplo de função de autocorrelação simples em R
Em outras palavras, a Simple Autocorrelation Function (FAS), ou em inglês, Autocorrelation Function, é uma função matemática que nos ajuda a saber qual a dependência que os dados de um determinado período têm com os mesmos de k períodos anteriores.
Geramos uma série temporal anual X que segue uma distribuição normal mais uma inércia. Também podemos usar dados reais.
Metodologia
Para trabalhar a análise de autocorrelação, os programas são essenciais. Programas como Python podem ser usados, mas para análise estatística e manipulação de dados recomendamos o R, ou sua versão melhorada, R Studio. Aqui trabalharemos com R.
Cálculo
E como escrevemos a fórmula FAS no código R?
Tanto o R quanto o Python possuem bibliotecas onde as fórmulas são vinculadas a um nome. Então, basta instalar a biblioteca que contém a fórmula que queremos usar e chamá-la no script.
No chion de R temos que escrever:
A função acf está dentro da biblioteca de estatísticas .
X -> Séries temporais que usamos como amostra para calcular o FAS.
acf(X, ylim=c(-1,1)) -> Função de Autocorrelação Simples em X com limites no eixo vertical entre -1 e 1, que são os valores que o coeficiente de autocorrelação pode assumir.
Verificação
Esta etapa não é necessária se tivermos usado o código anterior, pois ele calcula as próprias bandas de confiança.
Para determinar se os coeficientes de autocorrelação calculados são estatisticamente significativos, teremos que estabelecer faixas de confiança com os valores críticos. Dessa forma, dado um percentual de significância, podemos afirmar com certeza estatística se há ou não autocorrelação nos dados.
Da mesma forma que o coeficiente de correlação, o coeficiente de autocorrelação também assume normalidade e, portanto, calcularemos o intervalo de confiança da seguinte forma:
Definimos o teste de hipóteses como:
Com 95% de confiança e nível de significância de 5%, encontramos o famoso 1,96 nas tabelas normais. O valor crítico é dado por:
Onde a variância dos coeficientes é dada pela aproximação:
Embora forneçamos a fórmula, recomendamos o uso de programas estatísticos para maior precisão e velocidade.
Resultado
Todas as linhas que terminam fora da faixa de confiança significam que a série temporal apresenta autocorrelação no período indicado.
Então, com base no gráfico, vemos que há autocorrelação nesta série temporal nos períodos em que a linha se destaca da banda descontínua.
A primeira linha que está em 0 e dispara em direção a 1 pode ser ignorada, pois t deve ser estritamente maior que 0 e, neste caso, não é. Não faz muito sentido ter que fazer todos os passos anteriores para saber a autocorrelação do agora com o agora porque já sabemos: a correlação de uma variável consigo mesma é 1, então já temos a resposta.