J'essaie d'obtenir une compréhension intuitive du fonctionnement de l'analyse en composantes principales (ACP) dans l'espace (double) sujet . Considérons un ensemble de données 2D avec deux variables, et , et points de données (la matrice de données est et est supposée être centrée). La présentation habituelle de l'ACP est que …
Considérons l'identité élémentaire de la variance: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} Il s'agit d'une simple manipulation algébrique de la définition d'un moment central en moments non centraux. Il permet une manipulation pratique de dans d'autres contextes. Il permet également de calculer …
J'ai vu et apprécié la question Comprendre l'analyse des composants principaux , et maintenant j'ai la même question pour l'analyse des composants indépendants. Je veux dire que je veux poser une question complète sur les façons intuitives de comprendre l'ICA? Je veux le comprendre . Je veux en comprendre le …
J'ai pensé à écrire un article de blog sur cette intéressante analyse de Kleinberg (2002) qui explore la difficulté du clustering. Kleinberg décrit trois desiderata apparemment intuitifs pour une fonction de clustering et prouve ensuite qu'aucune fonction de ce type n'existe. Il existe de nombreux algorithmes de clustering qui satisfont …
J'ai lu ici que, étant donné un échantillon d'une distribution continue avec cdf , l'échantillon correspondant à suit une distribution uniforme standard.X1,X2,...,XnX1,X2,...,Xn X_1,X_2,...,X_n FXFX F_X Ui=FX(Xi)Ui=FX(Xi) U_i = F_X(X_i) J'ai vérifié cela en utilisant des simulations qualitatives en Python, et j'ai facilement pu vérifier la relation. import matplotlib.pyplot as plt …
J'ai travaillé avec la conviction que la médiane de l'échantillon est une mesure plus robuste de la tendance centrale que la moyenne de l'échantillon, car elle ignore les valeurs aberrantes. J'ai donc été surpris d'apprendre (dans la réponse à une autre question ) que pour les échantillons tirés d'une distribution …
Des questions): Quelle est l'idée et l'intuition derrière l'estimation du maximum de vraisemblance (QMLE; également connue sous le nom d'estimation du pseudo maximum de vraisemblance, PMLE)? Qu'est-ce qui fait que l'estimateur fonctionne lorsque la distribution d'erreur réelle ne correspond pas à la distribution d'erreur supposée? Le site Wikipedia pour QMLE …
Je suis confus quant à l'équation qui sert de définition du taux de risque. J'ai une idée de ce qu'est le taux de risque, mais je ne vois tout simplement pas comment l'équation exprime cette intuition. Si xxx est une variable aléatoire qui représente le moment du décès d'une personne …
Aujourd'hui, j'ai enseigné une classe d'introduction à la statistique et un étudiant m'a posé une question que je reformule ici: "Pourquoi l'écart type est-il défini comme le carré de la variance et non comme le carré de la somme des carrés sur N?" Nous définissons la variance de la population: …
La procédure EM apparaît, pour les non-initiés, comme une magie plus ou moins noire. Estimer les paramètres d'un HMM (par exemple) à l'aide de données supervisées. Décodez ensuite les données non marquées, en utilisant le sens avant-arrière pour «compter» les événements comme si les données étaient plus ou moins marquées. …
J'ai lu à plusieurs reprises que les effets aléatoires (BLUP / modes conditionnels pour, disons, les sujets) ne sont pas des paramètres d'un modèle linéaire à effets mixtes mais peuvent être dérivés des paramètres de variance / covariance estimés. Par exemple, Reinhold Kliegl et al. (2011) indiquent: Les effets aléatoires …
Dans les conférences vidéo de Harvard's Statistics 110: Probability course que l'on peut trouver sur iTunes et YouTube, j'ai rencontré ce problème. J'ai essayé de le résumer ici: Supposons que l'on nous donne une main aléatoire de deux cartes d'un paquet standard. Quelle est la probabilité que les deux cartes …
Je pensais que le concept d'ensemble typique était assez intuitif: une séquence de longueur nnn appartiendrait à l'ensemble typique si la probabilité de sortie de la séquence était élevée. Donc, toute séquence qui serait probable serait dans . (J'évite la définition formelle liée à l'entropie parce que j'essaie de la …
Pour autant que je sache, la corrélation de distance est un moyen robuste et universel de vérifier s'il existe une relation entre deux variables numériques. Par exemple, si nous avons un ensemble de paires de nombres: (x1, y1) (x2, y2) ... (xn, yn) nous pouvons utiliser la corrélation de distance …
Dans le livre de Steven Pinker, Better Angels of Our Nature , il note que La probabilité est une question de perspective. Vu à une distance suffisamment proche, les événements individuels ont des causes déterminées. Même un tirage au sort peut être prévu à partir des conditions de départ et …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.