Tau de Kendall (I)
É uma medida não paramétrica de dependência que identifica os pares concordantes e discordantes de duas variáveis. Uma vez identificados, os totais são calculados e o quociente é feito.
Correlações ranqueadas são uma alternativa não paramétrica como medida de dependência entre duas variáveis quando não podemos aplicar o coeficiente de correlação de Pearson.
Em outras palavras, atribuímos uma classificação às observações de cada variável e estudamos a relação de dependência entre duas variáveis dadas. Existem duas maneiras de calcular o Tau de Kendall; optamos por calcular a razão de dependência uma vez ordenadas as observações de cada variável. Em nosso exemplo, veremos que classificamos as classificações na coluna X em ordem crescente.
Matematicamente,
Definimos:
C n = número total de pares correspondentes.
NC n = número total de pares não concordantes (discordantes).
Procedimento e exemplo prático
Para obter o Tau de Kendall, devemos primeiro saber identificar pares concordantes e discordantes de duas variáveis.
Usaremos as preferências dos esquiadores. Neste exemplo, supomos que queremos avaliar se os esquiadores classificam suas preferências para esqui alpino ou esqui nórdico em uma estação i na mesma ordem. Suas classificações podem variar de 1 (muito preferível) a 7 (muito ligeiramente preferível).
Nossa pergunta seria: existe uma dependência entre as preferências dos esquiadores alpinos e dos esquiadores nórdicos em determinadas estações de esqui?
Definimos:
X = avaliação de esquiadores para esqui alpino na estação i.
Y = avaliação de esquiadores para praticar esqui nórdico na estação i.
C = pares concordantes.
NC = pares não concordantes/discordantes.
E i = estação de esqui i.
Procedimento
- Partimos de uma amostra de n=7 observações de resorts de esqui. Cada linha da tabela são classificações dadas pelos esquiadores. Cada par de estações pode ser concordante ou discordante. Nas colunas C e NC contamos apenas os pares em uma direção. Por exemplo, o par AB e BA são contados como um par para evitar repetição.
As observações obtidas são:
estação de esqui ( e ) |
X |
Z |
UMA |
1 |
1 |
B. |
dois |
3 |
C |
3 |
4 |
D |
4 |
dois |
E |
5 |
7 |
F |
6 |
6 |
G |
7 |
5 |
- Classificamos os elementos da coluna X em ordem crescente para que possamos compará-los com os elementos da coluna Z.
- Encontramos os pares concordantes e os pares discordantes.
estação de esqui ( e ) |
X |
Z |
C | NC | |
UMA |
1 |
1 |
6 |
0 |
|
B. |
dois |
3 |
5 |
0 |
|
C |
3 |
4 |
5 |
1 |
|
D |
4 |
dois |
4 |
0 |
|
E |
5 |
7 |
4 |
1 |
|
F |
6 |
6 |
4 |
1 |
|
G |
7 |
5 |
43 | 3 | Total |
- Observamos primeiro a coluna Z, pois a coluna X já está classificada em ordem crescente. Consequentemente, todas as classificações na coluna Z que não são ascendentes serão pares de estações discordantes.
- Quando procuramos pares de estações (concordantes e não concordantes) sempre sobrará a última linha de observações porque estamos procurando pares (conjuntos de duas observações).
- Todos aqueles abaixo de uma classificação de referência serão pares concordantes. No primeiro caso, ambos os esquiadores definem essa classificação de referência para 1. Todas as classificações abaixo de 1 serão pares concordantes com A. No total, temos 7 estações para classificar. Portanto, haverá 6 pares concordantes de A. Como não temos pares discordantes associados a A, colocaremos um zero.
Leia a segunda parte do Tau de Kendall (II)