J'entreprends un projet d'analyse de données qui consiste à enquêter sur les temps d'utilisation du site Web au cours de l'année. Ce que je voudrais faire, c'est comparer la "cohérence" des modèles d'utilisation, par exemple, leur proximité avec un modèle qui implique de l'utiliser une heure par semaine, ou un …
Je vais utiliser la divergence KL dans mon code python et j'ai eu ce tutoriel . Sur ce tutoriel, implémenter la divergence KL est assez simple. kl = (model * np.log(model/actual)).sum() Si je comprends bien, la distribution de probabilité de modelet actualdevrait être <= 1. Ma question est, quelle est …
J'ai regardé la page wikipedia pour la corrélation de distance où elle semble être caractérisée par la façon dont elle peut être calculée. Bien que je puisse faire les calculs, j'ai du mal à obtenir quelles mesures de corrélation de distance et pourquoi les calculs se présentent comme ils le …
J'utilise means clustering pour regrouper les voix des locuteurs. Lorsque je compare un énoncé avec des données de haut-parleur groupées, j'obtiens une distorsion moyenne (basée sur la distance euclidienne). Cette distance peut être comprise entre . Je veux convertir cette distance en un score de similitude . Veuillez me guider …
En étudiant la distance de Kullback – Leibler, il y a deux choses que nous apprenons très rapidement, c'est qu'elle ne respecte ni l'inégalité du triangle ni la symétrie, propriétés requises d'une métrique. Ma question est de savoir s'il existe une métrique de fonctions de densité de probabilité qui remplit …
Pour le clustering hiérarchique, je vois souvent les deux "métriques" suivantes (elles ne parlent pas exactement) pour mesurer la distance entre deux variables aléatoires et Y : XXXOuiYY\newcommand{\Cor}{\mathrm{Cor}} L'un ou l'autre remplit-il l'inégalité du triangle? Si oui, comment dois-je le prouver autrement que simplement faire un calcul de force brute? …
J'ai 17 variables numériques et 5 variables binaires (0-1), avec 73 échantillons dans mon jeu de données. J'ai besoin d'exécuter une analyse de cluster. Je sais que la distance de Gower est une bonne métrique pour les ensembles de données avec des variables mixtes. Cependant, je ne pouvais pas comprendre …
J'ai plus de 3000 vecteurs sur une grille bidimensionnelle, avec une distribution discrète approximativement uniforme. Certaines paires de vecteurs remplissent une certaine condition. Remarque: la condition n'est applicable qu'aux paires de vecteurs, pas aux vecteurs individuels. J'ai une liste d'environ 1500 de ces paires, appelons-le groupe 1. Le groupe 2 …
Supposons que j'ai un mélange de Gaussiens finis avec des poids, des moyens et des écarts-types connus. Les moyens ne sont pas égaux. La moyenne et l'écart type du mélange peuvent être calculés, bien sûr, car les moments sont des moyennes pondérées des moments des composants. Le mélange n'est pas …
Je comprends le raisonnement derrière la normalisation des colonnes, car il entraîne une pondération égale des entités, même si elles ne sont pas mesurées sur la même échelle - cependant, souvent dans la littérature du voisin le plus proche, les colonnes et les lignes sont normalisées. Quelle est la normalisation …
Je ne sais pas quelle fonction de distance entre les individus utiliser en cas d'attributs nominaux (catégoriques non ordonnés). Je lisais un manuel et ils suggèrent une fonction de correspondance simple , mais certains livres suggèrent que je devrais changer le nominal en attributs binaires et utiliser le coefficient de …
Un collègue a une fonction et pour nous c'est une boîte noire. La fonction mesure la similitude de deux objets.ssss(a,b)s(a,b)s(a,b) Nous savons avec certitude que a ces propriétés:sss Les scores de similitude sont des nombres réels compris entre 0 et 1, inclus. Seuls les objets qui sont auto-identiques ont des …
J'ai une matrice de covariance et je souhaite partitionner les variables en clusters en utilisant un clustering hiérarchique (par exemple, pour trier une matrice de covariance).n×nn×nn \times nkkk Existe-t-il une fonction de distance typique entre les variables (c'est-à-dire entre les colonnes / lignes de la matrice de covariance carrée)? Ou …
Je ne suis pas un écologiste communautaire, mais ces jours-ci, je travaille sur des données écologiques communautaires. Ce que je ne pouvais pas comprendre, à part les mathématiques de ces distances, ce sont les critères pour chaque distance à utiliser et dans quelles situations elle peut être appliquée. Par exemple, …
J'ai lu beaucoup de choses sur Dynamic Time Warping (DTW) récemment. Je suis très surpris qu'il n'y ait aucune littérature sur l'application du DTW aux séries chronologiques irrégulières, ou du moins je n'ai pas pu le trouver. Quelqu'un pourrait-il me donner une référence à quelque chose en rapport avec ce …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.