J'ai (~ un million) de vecteurs de caractéristiques. Il y a (~ un million) d'entités binaires, mais dans chaque vecteur, seulement (~ un millier) d'entre elles seraient égales à , les autres étant . Je recherche les paires de vecteurs qui ont au moins (~ cent) traits en commun ( …
Je suis assez nouveau dans les statistiques (une poignée de cours Uni de niveau débutant) et je me posais des questions sur l'échantillonnage à partir de distributions inconnues. Plus précisément, si vous n'avez aucune idée de la distribution sous-jacente, existe-t-il un moyen de "garantir" que vous obtenez un échantillon représentatif? …
J'ai lu un article wiki sur Apriori. J'ai du mal à comprendre le pruneau et l'étape Join. Quelqu'un peut-il m'expliquer comment l'algorithme Apriori fonctionne en termes simples (de telle sorte que les novices comme moi peuvent facilement comprendre)? Ce sera bien si quelqu'un explique le processus étape par étape qui …
La plupart des algorithmes de clustering que j'ai vus commencent par créer des distances de chaque point entre tous les points, ce qui devient problématique sur des ensembles de données plus importants. Y en a-t-il un qui ne le fait pas? Ou le fait-il dans une sorte d'approche partielle / …
Selon wiki, le critère de convergence le plus utilisé est "l'assignation n'a pas changé". Je me demandais si le cyclisme peut se produire si nous utilisons un tel critère de convergence? Je serais heureux si quelqu'un faisait référence à un article qui donne un exemple de cyclisme ou prouve que …
( Cela concerne ma question de programmation sur Stack Overflow : Bell Curve Gaussian Algorithm (Python et / ou C #) .) Sur Answers.com, j'ai trouvé cet exemple simple: Trouver la moyenne arithmétique (moyenne) => Somme de toutes les valeurs de l'ensemble, divisée par le nombre d'éléments de l'ensemble Trouver …
Donc, j'ai 16 essais dans lesquels j'essaie d'authentifier une personne à partir d'un trait biométrique en utilisant Hamming Distance. Mon seuil est fixé à 3,5. Mes données sont ci-dessous et seul l'essai 1 est un vrai positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 …
J'essaie de comprendre quelle est la différence entre le recuit simulé et l'exécution de plusieurs algorithmes gourmands d'escalade. D'après ma compréhension, l'algorithme gourmand poussera le score à un maximum local, mais si nous commençons avec plusieurs configurations aléatoires et appliquons gourmand à toutes, nous aurons plusieurs maximums locaux. Ensuite, nous …
Des algorithmes d'itération de politiques et de valeurs peuvent être utilisés pour résoudre des problèmes de processus de décision de Markov. J'ai du mal à comprendre les conditions nécessaires à la convergence. Si la politique optimale ne change pas pendant deux étapes (c'est-à-dire pendant les itérations i et i + …
J'ai lu les excellents commentaires sur la façon de traiter les valeurs manquantes avant d'appliquer SVD, mais j'aimerais savoir comment cela fonctionne avec un exemple simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Étant donné la matrice …
Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle se monthly spendtrouve la variable …
Méthode proposée: Étant donné une série temporelle , je veux calculer une moyenne mobile pondérée avec une fenêtre de moyenne de points, où les pondérations favorisent les valeurs plus récentes par rapport aux valeurs plus anciennes.Xjexix_iNNN En choisissant les poids, j'utilise le fait familier qu'une série géométrique converge vers 1, …
Dans ESL , Section 9.7, il y a un paragraphe indiquant que le temps de calcul d'une scission dans la croissance d'un arbre de classification (ou de régression) s'échelonne généralement comme où est le nombre de prédicteurs et est le nombre de échantillons.pNlogNpNlogNp N \log NpppNNN Une approche naïve se …
L'une des questions les plus importantes dans l'utilisation de l'analyse factorielle est son interprétation. L'analyse factorielle utilise souvent la rotation des facteurs pour améliorer son interprétation. Après une rotation satisfaisante, la matrice des facteurs de chargement pivotée L » aura la même capacité à représenter la matrice de corrélation et …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.