Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données




5
Pourquoi l'ANOVA est-elle enseignée / utilisée comme s'il s'agissait d'une méthodologie de recherche différente de la régression linéaire?
L’ANOVA équivaut à une régression linéaire avec l’utilisation de variables nominales appropriées. Les conclusions restent les mêmes, que vous utilisiez une ANOVA ou une régression linéaire. Compte tenu de leur équivalence, y a-t-il une raison pour laquelle l'ANOVA est utilisée au lieu de la régression linéaire? Remarque: je suis particulièrement …
91 regression  anova 

3
Est-il possible d'avoir une paire de variables aléatoires gaussiennes pour lesquelles la distribution conjointe n'est pas gaussienne?
Quelqu'un m'a posé cette question lors d'un entretien d'embauche et j'ai répondu que leur distribution commune est toujours gaussienne. Je pensais que je pouvais toujours écrire une gaussienne à deux variables avec leurs moyennes, leur variance et leurs covariances. Je me demande s’il peut exister un cas pour lequel la …

4
PCA et proportion de variance expliquée
En général, que veut dire que la fraction de la variance dans une analyse comme ACP est expliquée par la première composante principale? Est-ce que quelqu'un peut expliquer cela intuitivement, mais aussi donner une définition mathématique précise de ce que "variance expliquée" signifie en termes d'analyse en composantes principales (ACP)?Xxx …

11
Quand faut-il appeler la «régression linéaire» «apprentissage par la machine»?
Lors d'un récent colloque, le résumé du locuteur a affirmé qu'ils utilisaient l'apprentissage automatique. Au cours de l'entretien, la seule chose liée à l'apprentissage automatique était qu'ils effectuaient une régression linéaire sur leurs données. Après avoir calculé les coefficients d'ajustement optimal dans l'espace des paramètres 5D, ils ont comparé ces …



7
Comment gérer efficacement un projet d'analyse statistique?
Nous entendons souvent parler de gestion de projet et de modèles de conception en informatique, mais moins fréquemment en analyse statistique. Cependant, il semble qu'une étape décisive dans la conception d'un projet statistique efficace et durable consiste à garder les choses organisées. Je préconise souvent l'utilisation de R et une …

1
Interprétation de plot.lm ()
J'avais une question sur l'interprétation des graphiques générés par plot (lm) dans R. Je me demandais si vous pouviez me dire comment interpréter les tracés de localisation d'échelle et d'effet résiduel? Tous les commentaires seraient appréciés. Assumer des connaissances de base en statistique, régression et économétrie.

4
Pourquoi normaliser les images en soustrayant la moyenne image du jeu de données, au lieu de la moyenne actuelle de l’apprentissage en profondeur?
Il existe quelques variantes sur la façon de normaliser les images, mais la plupart semblent utiliser ces deux méthodes: Soustrayez la moyenne par canal calculée pour toutes les images (par exemple, VGG_ILSVRC_16_layers ) Soustrayez par pixel / canal calculé sur toutes les images (par exemple, CNN_S , voir aussi le …

1
Effets aléatoires croisés et imbriqués: en quoi diffèrent-ils et comment sont-ils spécifiés correctement dans lme4?
Voici comment j'ai compris les effets aléatoires imbriqués et croisés: Les effets aléatoires imbriqués se produisent lorsqu'un facteur de niveau inférieur apparaît uniquement dans un niveau particulier d'un facteur de niveau supérieur. Par exemple, les élèves dans les classes à un moment donné. En lme4pensant que nous représentons les effets …


4
Quand utiliser des GLM gamma?
La distribution gamma peut prendre une assez grande variété de formes et, étant donné le lien entre la moyenne et la variance à travers ses deux paramètres, elle semble appropriée pour traiter l'hétéroscédasticité dans des données non négatives, de manière à ce que les log ne vous faites pas sans …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.