Viés de sobrevivência Definição, o que é e conceito
O viés de sobrevivência é um viés que ocorre na coleta de dados quando os dados são excluídos da análise porque não existem mais hoje.
Esse viés surge em uma ampla variedade de contextos em que focamos apenas nesses dados de “sobrevivência”. Um exemplo disso é visto quando as empresas pesquisam seus clientes sobre um de seus produtos. Mas deixam no esquecimento os não clientes, que neste caso seriam os “não sobreviventes”.
Nesse caso, tirar conclusões desse estudo seria errado. Uma vez que os resultados seriam tendenciosos apenas para a população “sobrevivente”. E não seriam resultados representativos.
Viés de sobrevivência na prática
Um exemplo claro desse viés pode ser visto no estudo dos resultados dos fundos de investimento. Onde a maioria das bases de dados inclui apenas os fundos que existem atualmente. Sem levar em conta os fundos que existiam no passado.
A razão pela qual eles não existem hoje é porque seu desempenho tem sido pior do que os “sobreviventes”. Ou mesmo vários fundos se fundiram em um. Portanto, a análise está sendo realizada naqueles fundos com os melhores resultados. E esse viés tende a superestimar o desempenho da amostra desses fundos.
O principal problema com isso não é mais apenas a superestimação do desempenho dos fundos. Em vez disso, a amostra selecionada não seria uma amostra aleatória da população total. E, portanto, os resultados do estudo podem não ser representativos da população. Que no final é isso que estamos procurando ao selecionar uma amostra aleatória da população.
Solução para o viés de sobrevivência
Vamos imaginar que queremos selecionar algum fundo de investimento para investir, com base em seu comportamento passado. Para evitar esse viés de sobrevivência e otimizar essa seleção, devemos realizar as seguintes etapas:
- Escolha o horizonte temporal com o qual pretendemos trabalhar. Por exemplo, dez, quinze ou vinte anos de história.
- Pegue todos os fundos existentes desde o início do horizonte de tempo, independentemente de existirem ou não.
- A partir daí, selecione a amostra dessa população para o estudo comportamental.
A ideia disso é, no final, conseguir aquela amostra aleatória da população. E a partir daí, as conclusões obtidas, se pudessem ser representativas daquela população.