Análise discriminante
A análise discriminante linear, ou Análise Discriminante Linear (LDA), é uma técnica estatística que cria uma função capaz de classificar fenômenos, levando em consideração uma série de variáveis discriminantes e uma probabilidade de pertencimento.
Portanto, estamos diante de um tipo de procedimento estatístico que busca agrupar com base em certas semelhanças. Desta forma, permite quantificar a probabilidade de pertencer a um ou outro grupo. Esses grupos são conhecidos a priori, diferentemente da análise de cluster.
Modelo matemático de análise discriminante
Vamos ver como seria o modelo matemático de uma análise discriminante.
É muito simples, pois é baseado em um sistema de equações lineares. Claro, a análise se torna mais complicada, mas isso estaria fora do trabalho de Novaeconomiahoje, a economia simples.
Como podemos ver, são um conjunto de equações cuja variável dependente (y) representa determinados escores. Estas, por sua vez, são funções lineares de outras variáveis discriminantes (X) e de uma série de parâmetros (a).
O objetivo, por meio dessas combinações lineares, é maximizar a variância entre os grupos e minimizar a variância entre os grupos. Dessa forma, novos casos podem ser agrupados com uma certa probabilidade a partir da qual podemos saber seu valor, desde que atendam a esses critérios.
Processo a seguir para realizar uma análise discriminante
Vejamos como uma análise desse tipo pode ser realizada:
- Primeiro você precisa criar uma tabela de dados com casos e variáveis. Uma variável categórica que define cada um dos grupos também é incluída.
- Em seguida, o modelo matemático é gerado com dados numéricos. Isso será baseado no que vimos na seção anterior. Softwares estatísticos como o SPSS ou o R gratuito automatizam todo o processo.
- Por fim, com esta análise poderemos explicar porque cada caso pertence a um ou outro grupo e, ainda, estabelecer um critério de pertinência para novos casos. Isso será baseado na probabilidade de ser incluído em um ou outro.
Exemplos de aplicação de análise discriminante
Por fim, vejamos alguns exemplos de aplicação da análise discriminante.
Lembremos também que em todos eles o objetivo é criar uma função discriminante que agrupe cada novo caso de acordo com uma probabilidade.
- Queremos classificar vários países com base em seus dados macroeconômicos : Países subdesenvolvidos, emergentes ou desenvolvidos (grupos). Criamos a função discriminante para que possamos calcular a probabilidade de um país pertencer a um ou outro grupo.
- Queremos realizar uma campanha de marketing e estamos interessados em saber em quais grupos classificar os indivíduos : Desta forma, poderemos responder a algumas perguntas como quais seriam as características de um cliente ocasional.
- Queremos conhecer o nível de risco (grupo) de determinados clientes em relação à concessão de um empréstimo : Usaremos variáveis relacionadas à sua renda, despesas mensais, histórico ou tipo de trabalho. A função discriminante nos fornece informações relevantes sobre solvência.
Como podemos ver, a análise discriminante é muito útil em muitas situações. Mas não apenas relacionado à economia, também é usado em medicina, geologia ou biologia, entre outros campos.