Vous pouvez utiliser le coefficient de similitude universel de Gower (voir Sneath & Sokal 1973, pp 135-136), qui pour deux OTU et est
pour tous les caractères .jk
Sg= ∑nje= 1wi , j, ksi , j , k∑ni = 1wi , j , k
je
Le poids est soit 1 soit 0, selon que la comparaison est valide ou non (données manquantes, absence de caractère binaire dans les deux OTU). Des schémas de pesée plus compliqués ont été publiés.wi , j , k
si , j , k est calculé pour
variables binaires: 1 pour la concordance, 0 pour la discordance (équivalent au coefficient de Jaccard si est réglé sur 0 pour les absences concordantes)wi , j , k
caractères multi-états (nominaux ou ordinaux): 1 pour l'égalité, 0 sinon (équivalent au coefficient d'appariement simple)
caractère cardinal: avec la plage de caractères (soit dans la population, soit dans l'échantillon).si , j , k= 1 - | Xi , j- Xi , k|RjeRjeje
La bonne chose à propos de est qu'il peut non seulement gérer tous les types de données, mais qu'il est également robuste contre les données manquantes. Il en résulte également des matrices de similitude semi-définie positives, c'est-à-dire que les OTU sont représentées par des points dans l'espace euklidien (au moins sinon trop de données manquent).Sg
La distance entre les OTU peut être représentée par1 - Sg------√