J'ai 17 variables numériques et 5 variables binaires (0-1), avec 73 échantillons dans mon jeu de données. J'ai besoin d'exécuter une analyse de cluster. Je sais que la distance de Gower est une bonne métrique pour les ensembles de données avec des variables mixtes. Cependant, je ne pouvais pas comprendre comment la distance de Gower calcule la différence entre les variables binaires . Il me semble que ce n'est pas différent de la distance euclidienne.
Gower
? stats.stackexchange.com/a/15313/3277