Statistiques et Big Data

12

Exemples réels de distributions avec asymétrie négative

Inspiré par des " exemples concrets de distributions communes ", je me demande quels exemples pédagogiques les gens utilisent pour démontrer une asymétrie négative? Il existe de nombreux exemples "canoniques" de distributions symétriques ou normales utilisées dans l'enseignement - même si celles comme la taille et le poids ne survivent …

20 distributions skewness teaching

2

Qu'est-ce que l'apprentissage par renforcement récurrent

Je suis récemment tombé sur le mot «apprentissage par renforcement récurrent». Je comprends ce qu'est un «réseau neuronal récurrent» et ce qu'est un «apprentissage par renforcement», mais je n'ai pas trouvé beaucoup d'informations sur ce qu'est un «apprentissage par renforcement récurrent». Quelqu'un peut-il m'expliquer ce qu'est un «apprentissage par renforcement …

20 machine-learning reinforcement-learning

3

Une valeur de p de 0,04993 est-elle suffisante pour rejeter l'hypothèse nulle?

Dans un test de signification statistique des rangs signés de Wilcoxon, nous avons trouvé des données qui produisent une valeur de de . Avec un seuil de , ce résultat est-il suffisant pour rejeter l'hypothèse nulle, ou est-il plus sûr de dire que le test n'était pas concluant, car si …

20 hypothesis-testing statistical-significance p-value

1

Intuition de l'estimateur sandwich

Wikipedia et la vignette du package sandwich R donnent de bonnes informations sur les hypothèses supportant les erreurs standard des coefficients OLS et le contexte mathématique des estimateurs sandwich. Je ne sais toujours pas comment le problème de l'hétéroscédasticité résiduelle est abordé, probablement parce que je ne comprends pas complètement …

20 multiple-regression residuals heteroscedasticity robust-standard-error

5

Motivation de l'algorithme de maximisation des attentes

Dans l'approche de l'algorithme EM, nous utilisons l'inégalité de Jensen pour arriver àlogp(x|θ)≥∫logp(z,x|θ)p(z|x,θ(k))dz−∫logp(z|x,θ)p(z|x,θ(k))dzlog⁡p(x|θ)≥∫log⁡p(z,x|θ)p(z|x,θ(k))dz−∫log⁡p(z|x,θ)p(z|x,θ(k))dz\log p(x|\theta) \geq \int \log p(z,x|\theta) p(z|x,\theta^{(k)}) dz - \int \log p(z|x,\theta) p(z|x,\theta^{(k)})dz et définir par \ theta ^ {(k + 1)} = \ arg \ max _ {\ theta} \ int \ log p (z, x | …

20 mixture expectation-maximization

2

Algorithme EM implémenté manuellement

Je veux implémenter l'algorithme EM manuellement, puis le comparer aux résultats normalmixEMdu mixtoolspackage. Bien sûr, je serais heureux si les deux aboutissaient aux mêmes résultats. La référence principale est Geoffrey McLachlan (2000), Finite Mixture Models . J'ai une densité de mélange de deux gaussiens, sous forme générale, la log-vraisemblance est …

20 r expectation-maximization gaussian-mixture

3

Test de séparabilité linéaire

Existe-t-il un moyen de tester la séparabilité linéaire d'un ensemble de données à deux classes dans des dimensions élevées? Mes vecteurs de caractéristiques mesurent 40 ans. Je sais que je peux toujours exécuter des expériences de régression logistique et déterminer le taux de réussite par rapport au taux de fausse …

20 machine-learning classification

1

Les variables aléatoires sont-elles corrélées si et seulement si leurs rangs sont corrélés?

Supposons que sont des variables aléatoires continues avec des seconds moments finis. La version démographique du coefficient de corrélation de rang de Spearman ρ_s peut être définie comme le coefficient produit-moment de Pearson ρ des intégrales de probabilité transforme F_X (X) et F_Y (Y) , où F_X, F_Y sont les …

20 correlation pearson-r spearman-rho

2

Peut-on voir la forme d'une courbe normale quelque part dans la nature?

Je ne veux pas savoir si certains phénomènes dans la nature ont une distribution normale, mais si nous pouvons quelque part voir la forme de la courbe normale comme nous pouvons le voir par exemple dans la boîte de Galton. Voir cette figure de Wikipedia. Notez que de nombreuses formes …

20 distributions normality-assumption

4

Comment fonctionne une distribution de Poisson lors de la modélisation de données continues et entraîne-t-elle une perte d'informations?

Une collègue analyse certaines données biologiques pour sa thèse avec une mauvaise hétéroscédasticité (figure ci-dessous). Elle est en train de l'analyser avec un modèle mixte mais a toujours des problèmes avec les résidus. La transformation logarithmique des variables de réponse nettoie les choses et sur la base des commentaires sur …

20 mixed-model poisson-distribution biostatistics

3

Connexion entre la métrique de Fisher et l'entropie relative

Quelqu'un peut-il prouver le lien suivant entre la métrique d'information de Fisher et l'entropie relative (ou divergence KL) d'une manière purement mathématique rigoureuse? D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(∥da∥3)D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(‖da‖3)D( p(\cdot , a+da) \parallel p(\cdot,a) ) =\frac{1}{2} g_{i,j} \, da^i \, da^j + (O( \|da\|^3)g i , j = ∫ ∂ i ( log p ( …

20 mathematical-statistics kullback-leibler fisher-information

4

Transformation pour augmenter le kurtosis et l'asymétrie du rv normal

Je travaille sur un algorithme qui repose sur le fait que les observations sont normalement distribuées, et je voudrais tester empiriquement la robustesse de l'algorithme à cette hypothèse.OuiOuiY Pour ce faire, je cherchais une suite de transformations qui perturberait progressivement la normalité de . Par exemple, si les sont normaux, …

20 data-transformation normality-assumption skewness kurtosis

1

Pourquoi la taille n'est-elle pas nécessaire pour les arbres forestiers aléatoires?

Breiman dit que les arbres sont cultivés sans élagage. Pourquoi? Je veux dire qu'il doit y avoir une raison solide pour que les arbres de la forêt aléatoire ne soient pas élagués. D'un autre côté, il est considéré comme très important d'élaguer un seul arbre de décision pour éviter un …

20 machine-learning

1

avertissement et validation croisée de libsvm "atteignant le nombre maximal d'itérations"

J'utilise libsvm en mode C-SVC avec un noyau polynomial de degré 2 et je dois former plusieurs SVM. Chaque ensemble d'entraînement a 10 fonctionnalités et 5000 vecteurs. Pendant la formation, je reçois cet avertissement pour la plupart des SVM que je forme: WARNING: reaching max number of iterations optimization finished, …

20 machine-learning cross-validation svm regularization libsvm

2

Quelle est la robustesse du coefficient de corrélation de Pearson aux violations de la normalité?

Les données pour certains types de variables ont tendance à être anormales lorsqu'elles sont mesurées dans des populations particulières (par exemple, les niveaux de dépression dans une population de personnes souffrant d'un trouble dépressif majeur). Étant donné que Pearson suppose la normalité, quelle est la robustesse de la statistique de …

20 correlation