Statistiques et Big Data

3

Quelle est la relation entre les modèles hiérarchiques, les réseaux de neurones, les modèles graphiques, les réseaux bayésiens?

Ils semblent tous représenter des variables aléatoires par les nœuds et une (in) dépendance via les arêtes (éventuellement dirigées). Je suis particulièrement intéressé par le point de vue d'un bayésien.

34 causality neural-networks multilevel-analysis graphical-model

7

Pourquoi est-il mauvais d'enseigner aux élèves que les valeurs p sont la probabilité que les résultats soient dus au hasard?

Quelqu'un peut-il, s’il vous plaît, donner une explication succincte de la raison pour laquelle il n’est pas judicieux d’enseigner aux élèves qu’une valeur p est la probabilité (leurs résultats sont dus à une chance [aléatoire]). D'après ce que je comprends, une p-value est le prob (obtenir des données plus extrêmes …

34 p-value randomness teaching

4

Comment interpréter la moyenne du complot Silhouette?

J'essaie d'utiliser le tracé de la silhouette pour déterminer le nombre de clusters dans mon jeu de données. Étant donné le jeu de données Train , j'ai utilisé le code matlab suivant Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s = silhouette(Train_data,centroid,'sqeuclid'); Result = …

34 data-visualization clustering matlab

3

Comment la validation croisée surmonte-t-elle le problème de surajustement?

Pourquoi une procédure de validation croisée résout-elle le problème de surapprentissage d'un modèle?

34 regression model-selection cross-validation

4

X et Y ne sont pas corrélés, mais X est un prédicteur significatif de Y dans la régression multiple. Qu'est-ce que ça veut dire?

X et Y ne sont pas corrélés (-.01); Cependant, lorsque je place X dans une régression multiple prédisant Y, aux côtés de trois autres variables (liées) (A, B, C), X et deux autres variables (A, B) sont des prédicteurs significatifs de Y. Notez que les deux autres ( Les variables …

34 regression correlation interpretation causality

3

Pourquoi le t-SNE n'est-il pas utilisé comme technique de réduction de la dimensionnalité pour la classification ou le regroupement?

Lors d'une récente mission, il nous a été dit d'utiliser PCA sur les chiffres du MNIST pour réduire les dimensions de 64 (8 x 8 images) à 2. Nous avons ensuite dû regrouper les chiffres à l'aide d'un modèle de mélange gaussien. La PCA n'utilisant que 2 composantes principales ne …

34 classification clustering pca dimensionality-reduction tsne

3

Comment interpréter la diminution moyenne de l'exactitude et la diminution moyenne de GINI dans les modèles de forêt aléatoire

J'ai du mal à comprendre comment interpréter la sortie d'importance variable du paquet Random Forest. La diminution moyenne de la précision est généralement décrite comme "la diminution de la précision du modèle due à la permutation des valeurs dans chaque fonction". S'agit-il d'une déclaration concernant la fonctionnalité dans son ensemble …

34 r machine-learning classification random-forest

2

Pourquoi un test du rapport de vraisemblance est-il distribué chi-carré?

Pourquoi la statistique de test d'un test de rapport de probabilité est-elle distribuée en khi-deux? 2 ( ln La l t m o d e l - ln Ln u l l m o d e l ) ~ Χ2réFun l t- dFn u l l2(ln⁡ Lalt model−ln⁡ Lnull model)∼χdfalt−dfnull22(\ln …

34 distributions chi-squared likelihood-ratio

5

Qu'est-ce qu'un modèle bayésien?

Puis-je appeler un modèle dans lequel le théorème de Bayes est utilisé comme un "modèle bayésien"? Je crains qu'une telle définition ne soit trop large. Alors, quel est exactement un modèle bayésien?

34 machine-learning bayesian

3

Pourquoi y a-t-il une différence entre le calcul manuel d'un intervalle de confiance de 95% selon la régression logistique et l'utilisation de la fonction confint () dans R?

Cher tout le monde - J'ai remarqué quelque chose d'étrange que je ne peux pas expliquer, pouvez-vous? En résumé: l'approche manuelle pour calculer un intervalle de confiance dans un modèle de régression logistique et la fonction R confint()donnent des résultats différents. Je suis passé par la régression logistique appliquée de …

34 r regression logistic confidence-interval profile-likelihood correlation mcmc error mixture measurement data-augmentation r logistic goodness-of-fit r time-series exponential descriptive-statistics average expected-value data-visualization anova teaching hypothesis-testing multivariate-analysis r r mixed-model clustering categorical-data unsupervised-learning r logistic anova binomial estimation variance expected-value r r anova mixed-model multiple-comparisons repeated-measures project-management r poisson-distribution control-chart project-management regression residuals r distributions data-visualization r unbiased-estimator kurtosis expected-value regression spss meta-analysis r censoring regression classification data-mining mixture

4

Quel est le côté faible des arbres de décision?

Les arbres de décision semblent être une méthode d’apprentissage automatique très compréhensible. Une fois créé, il peut être facilement inspecté par un humain, ce qui constitue un avantage considérable pour certaines applications. Quels sont les inconvénients pratiques des arbres de décision?

34 machine-learning nonparametric cart

6

Data mining: Comment dois-je m'y prendre pour trouver la forme fonctionnelle?

Je suis curieux de savoir les procédures reproductibles qui peuvent être utilisées pour découvrir la forme fonctionnelle de la fonction y = f(A, B, C) + error_termoù mon entrée est seulement un ensemble d'observations ( y, A, Bet C). Veuillez noter que la forme fonctionnelle de fest inconnue. Considérez le …

34 regression machine-learning algorithms model-selection data-mining

5

Trouver la valeur attendue à l'aide de CDF

Je vais commencer par dire qu'il s'agit d'un problème de devoirs tout droit sorti du livre. J'ai passé quelques heures à chercher comment trouver les valeurs attendues et j'ai déterminé que je ne comprenais rien. Soit XXX le CDF F(x)=1−x−α,x≥1F(x)=1−x−α,x≥1F(x) = 1 - x^{-\alpha}, x\ge1 . Recherchez E(X)E(X)E(X) pour les …

34 self-study expected-value

3

Qu'entend-on par «apprenant faible»?

Quelqu'un peut-il me dire ce que l'on entend par l'expression «apprenant faible»? Est-ce supposé être une hypothèse faible? Je suis confus quant à la relation entre un apprenant faible et un classificateur faible. Les deux sont les mêmes ou y a-t-il une différence? Dans l'algorithme AdaBoost, T=10. Que veut-on dire …

34 classification svm terminology adaboost pac-learning

2

Est-ce la méthodologie de régression de l'état de l'art?

Cela fait longtemps que je suis des compétitions Kaggle et je me rends compte que de nombreuses stratégies gagnantes impliquent l’utilisation d’au moins un des «trois grands»: l’ensachage, le boost et l’empilement. Pour les régressions, plutôt que de se concentrer sur la construction d'un meilleur modèle de régression possible, la …

33 predictive-models boosting bagging stacking model-averaging