Statistiques et Big Data intuition

1

Compréhension géométrique de l'ACP dans l'espace (double) sujet

J'essaie d'obtenir une compréhension intuitive du fonctionnement de l'analyse en composantes principales (ACP) dans l'espace (double) sujet . Considérons un ensemble de données 2D avec deux variables, et , et points de données (la matrice de données est et est supposée être centrée). La présentation habituelle de l'ACP est que …

19 pca linear-algebra intuition geometry

5

Intuition (géométrique ou autre) de

Considérons l'identité élémentaire de la variance: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} Il s'agit d'une simple manipulation algébrique de la définition d'un moment central en moments non centraux. Il permet une manipulation pratique de dans d'autres contextes. Il permet également de calculer …

18 variance descriptive-statistics intuition

2

Comprendre l'analyse des composants indépendants

J'ai vu et apprécié la question Comprendre l'analyse des composants principaux , et maintenant j'ai la même question pour l'analyse des composants indépendants. Je veux dire que je veux poser une question complète sur les façons intuitives de comprendre l'ICA? Je veux le comprendre . Je veux en comprendre le …

18 intuition ica

2

Clustering - Intuition derrière le théorème d'impossibilité de Kleinberg

J'ai pensé à écrire un article de blog sur cette intéressante analyse de Kleinberg (2002) qui explore la difficulté du clustering. Kleinberg décrit trois desiderata apparemment intuitifs pour une fonction de clustering et prouve ensuite qu'aucune fonction de ce type n'existe. Il existe de nombreux algorithmes de clustering qui satisfont …

17 mathematical-statistics clustering intuition hierarchical-clustering

2

Pourquoi le CDF d'un échantillon est-il uniformément distribué

J'ai lu ici que, étant donné un échantillon d'une distribution continue avec cdf , l'échantillon correspondant à suit une distribution uniforme standard.X1,X2,...,XnX1,X2,...,Xn X_1,X_2,...,X_n FXFX F_X Ui=FX(Xi)Ui=FX(Xi) U_i = F_X(X_i) J'ai vérifié cela en utilisant des simulations qualitatives en Python, et j'ai facilement pu vérifier la relation. import matplotlib.pyplot as plt …

17 pdf uniform cdf intuition

2

Pour quelles distributions (symétriques) l'échantillon signifie-t-il un estimateur plus efficace que la médiane de l'échantillon?

J'ai travaillé avec la conviction que la médiane de l'échantillon est une mesure plus robuste de la tendance centrale que la moyenne de l'échantillon, car elle ignore les valeurs aberrantes. J'ai donc été surpris d'apprendre (dans la réponse à une autre question ) que pour les échantillons tirés d'une distribution …

17 distributions median intuition mean efficiency

3

Idée et intuition derrière l'estimation du maximum de vraisemblance (QMLE)

Des questions): Quelle est l'idée et l'intuition derrière l'estimation du maximum de vraisemblance (QMLE; également connue sous le nom d'estimation du pseudo maximum de vraisemblance, PMLE)? Qu'est-ce qui fait que l'estimateur fonctionne lorsque la distribution d'erreur réelle ne correspond pas à la distribution d'erreur supposée? Le site Wikipedia pour QMLE …

17 maximum-likelihood references intuition quasi-likelihood

3

Intuition derrière le taux de risque

Je suis confus quant à l'équation qui sert de définition du taux de risque. J'ai une idée de ce qu'est le taux de risque, mais je ne vois tout simplement pas comment l'équation exprime cette intuition. Si xxx est une variable aléatoire qui représente le moment du décès d'une personne …

16 survival intuition hazard

2

Pourquoi l'écart-type est-il défini comme le carré de la variance et non comme le carré de la somme des carrés sur N?

Aujourd'hui, j'ai enseigné une classe d'introduction à la statistique et un étudiant m'a posé une question que je reformule ici: "Pourquoi l'écart type est-il défini comme le carré de la variance et non comme le carré de la somme des carrés sur N?" Nous définissons la variance de la population: …

16 variance standard-deviation intuition teaching

1

EM, y a-t-il une explication intuitive?

La procédure EM apparaît, pour les non-initiés, comme une magie plus ou moins noire. Estimer les paramètres d'un HMM (par exemple) à l'aide de données supervisées. Décodez ensuite les données non marquées, en utilisant le sens avant-arrière pour «compter» les événements comme si les données étaient plus ou moins marquées. …

16 expectation-maximization intuition

2

Intuition sur l'estimation des paramètres dans les modèles mixtes (paramètres de variance vs modes conditionnels)

J'ai lu à plusieurs reprises que les effets aléatoires (BLUP / modes conditionnels pour, disons, les sujets) ne sont pas des paramètres d'un modèle linéaire à effets mixtes mais peuvent être dérivés des paramètres de variance / covariance estimés. Par exemple, Reinhold Kliegl et al. (2011) indiquent: Les effets aléatoires …

15 mixed-model intuition blup

4

Comment développer l'intuition de la probabilité conditionnelle?

Dans les conférences vidéo de Harvard's Statistics 110: Probability course que l'on peut trouver sur iTunes et YouTube, j'ai rencontré ce problème. J'ai essayé de le résumer ici: Supposons que l'on nous donne une main aléatoire de deux cartes d'un paquet standard. Quelle est la probabilité que les deux cartes …

15 probability conditional-probability intuition

4

Concept d'ensemble typique

Je pensais que le concept d'ensemble typique était assez intuitif: une séquence de longueur nnn appartiendrait à l'ensemble typique si la probabilité de sortie de la séquence était élevée. Donc, toute séquence qui serait probable serait dans . (J'évite la définition formelle liée à l'entropie parce que j'essaie de la …

15 entropy intuition information-theory

2

Comprendre les calculs de corrélation de distance

Pour autant que je sache, la corrélation de distance est un moyen robuste et universel de vérifier s'il existe une relation entre deux variables numériques. Par exemple, si nous avons un ensemble de paires de nombres: (x1, y1) (x2, y2) ... (xn, yn) nous pouvons utiliser la corrélation de distance …

15 correlation independence intuition distance-covariance

4

L'opération du hasard dans un monde déterministe

Dans le livre de Steven Pinker, Better Angels of Our Nature , il note que La probabilité est une question de perspective. Vu à une distance suffisamment proche, les événements individuels ont des causes déterminées. Même un tirage au sort peut être prévu à partir des conditions de départ et …

15 probability central-limit-theorem intuition

Questions marquées «intuition»