Comment la distance de Gower calcule-t-elle la différence entre les variables binaires?


13

J'ai 17 variables numériques et 5 variables binaires (0-1), avec 73 échantillons dans mon jeu de données. J'ai besoin d'exécuter une analyse de cluster. Je sais que la distance de Gower est une bonne métrique pour les ensembles de données avec des variables mixtes. Cependant, je ne pouvais pas comprendre comment la distance de Gower calcule la différence entre les variables binaires . Il me semble que ce n'est pas différent de la distance euclidienne.


Votre question n'est pas tout à fait claire. Demandez-vous simplement «comment la distance de Gower calcule-t-elle la différence entre les variables binaires»? Que signifie "il n'y a pas de différence avec Euclidienne"?
gung - Réintégrer Monica

1
Je vous remercie. Désolé, je demande comment Gower calcule la différence entre les variables binaires. Je veux dire, je ne pouvais pas comprendre les différences entre les deux. Euclidienne et Gower pour variable binaire.
Emrah Bilgiç

Avez-vous recherché ce site Gower? stats.stackexchange.com/a/15313/3277
ttnphns

Oui je l'ai fait. La distance euclidienne est 0, si les deux échantillons ont la même valeur, 1 sinon. Et Gower?
Emrah Bilgiç

4
@ EmrahBilgiç, la métrique de Gower est la similitude, pas la distance. Il devient "distance" lorsqu'il est soustrait de 1. Lisez sous le lien ci-dessus comment il traite les données binaires.
ttnphns

Réponses:


5

Que diriez-vous des attributs binaires qui ont les valeurs "m" et "f", pour "mâle" et "femelle"?

Vous vous rendez compte que pour une variable dicotomique, tout ce que vous pouvez en tirer est "identique" ou "différent"? La différence de point clé entre les distances n'est pas si la valeur est 1 ou 0; mais comment plusieurs variables sont combinées.


3

Gower distance utilise Manhattan pour calculer la distance entre les points de données continus et Dice pour calculer la distance entre les points de données catégoriels

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.