Les fonctions de distance font référence aux fonctions utilisées pour quantifier la notion de distance entre les membres d'un ensemble ou entre les objets.
J'ai lu que "la distance euclidienne n'est pas une bonne distance dans les grandes dimensions". Je suppose que cette déclaration a quelque chose à voir avec la malédiction de la dimensionnalité, mais quoi au juste? En outre, qu'est-ce que les «grandes dimensions»? J'appliquais la classification hiérarchique en utilisant la distance …
Lorsque vous utilisez l'analyse par grappes sur un ensemble de données pour regrouper des cas similaires, vous devez choisir parmi un grand nombre de méthodes de regroupement et de mesures de distance. Parfois, un choix peut influencer l’autre, mais il existe de nombreuses combinaisons de méthodes possibles. Quelqu'un at-il des …
Existe-t-il un objectif spécifique en termes d'efficacité ou de fonctionnalité pour lequel l'algorithme k-means n'utilise pas, par exemple, la similarité cosinus comme métrique de distance, mais ne peut utiliser que la norme euclidienne? En général, la méthode K-means sera-t-elle conforme et sera-t-elle correcte si d'autres distances que Euclidean sont considérées …
Supposons que deux objets dont l'emplacement exact sont inconnus, mais distribués selon des distributions normales avec des paramètres connus (par exemple, et . Nous pouvons supposer qu'il s'agit de deux normales normales à deux variables, telles que les positions sont décrites par une distribution sur les (c.-à-d. Que et sont …
Je peux voir qu'il y a beaucoup de différences formelles entre les mesures de distance Kullback – Leibler vs Kolmogorov-Smirnov. Cependant, les deux sont utilisés pour mesurer la distance entre les distributions. Y a-t-il une situation typique où l'un devrait être utilisé à la place de l'autre? Quelle est la …
Dans mon jeu de données, nous avons à la fois des variables continues et des variables naturellement discrètes. Je veux savoir si nous pouvons faire une classification hiérarchique en utilisant les deux types de variables. Et si oui, quelle mesure de distance est appropriée?
[Le titre initial "Mesure de la similitude pour les arbres de clustering hiérarchiques" a été modifié par la suite par @ttnphns pour mieux refléter le sujet] J'effectue un certain nombre d' analyses de grappes hiérarchiques sur une trame de données des dossiers des patients (par exemple similaire à http://www.biomedcentral.com/1471-2105/5/126/figure/F1?highres=y ) …
Je cherche une bonne terminologie pour décrire ce que j'essaie de faire, pour faciliter la recherche de ressources. Donc, disons que j'ai deux grappes de points A et B, chacune associée à deux valeurs, X et Y, et je veux mesurer la "distance" entre A et B - c'est-à-dire quelle …
Dans un contexte où l'on observe distribués à partir d'une distribution de densité , je me demande s'il existe un estimateur non biaisé (basé sur les ) de la distance de Hellinger à une autre distribution de densité , à savoir f X i f 0 H ( f , …
J'ai un ensemble de données où chaque donnée se compose de mesures différentes. Pour chaque mesure, j'ai une valeur de référence. Je voudrais savoir à quel point chaque donnée est proche de la valeur de référence.nnn J'ai pensé à utiliser la distance euclidienne pondérée comme ceci: réx , b= ( …
J'utilise le clustering hiérarchique pour analyser les données de séries chronologiques. Mon code est implémenté à l'aide de la fonction MathematicaDirectAgglomerate[...] , qui génère des clusters hiérarchiques compte tenu des entrées suivantes: une matrice de distance D le nom de la méthode utilisée pour déterminer la liaison inter-cluster. J'ai calculé …
Je regroupe les distributions de probabilité en utilisant l' algorithme de propagation d'affinité et je prévois d'utiliser la divergence de Jensen-Shannon comme métrique de distance. Est-il correct d'utiliser JSD lui-même comme distance ou JSD au carré? Pourquoi? Quelles différences résulteraient du choix de l'un ou de l'autre?
Quelqu'un utilise-t-il les métriques L1L1L_1 ou L.5L.5L_.5 pour le clustering, plutôt que L2L2L_2 ? Aggarwal et al., A propos du comportement surprenant des mesures de distance dans un espace de grande dimension, a déclaré (en 2001) que L1L1L_1 est toujours plus préférable que la métrique de distance euclidienne L2L2L_2 pour …
Je travaille juste avec le livre Collective Intelligence (de Toby Segaran) et suis tombé sur le score de distance euclidienne. Dans le livre, l'auteur montre comment calculer la similitude entre deux tableaux de recommandations (c'est-à-dire .personne × film ↦ partition )person×movie↦score)\textrm{person} \times \textrm{movie} \mapsto \textrm{score}) Il calcule la distance euclidienne …
Remarque: cette question est une rediffusion, car ma question précédente a dû être supprimée pour des raisons juridiques. En comparant PROC MIXED de SAS avec la fonction lmedu nlmepackage dans R, je suis tombé sur des différences assez confuses. Plus précisément, les degrés de liberté dans les différents tests diffèrent …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.