Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Inspiré par des " exemples concrets de distributions communes ", je me demande quels exemples pédagogiques les gens utilisent pour démontrer une asymétrie négative? Il existe de nombreux exemples "canoniques" de distributions symétriques ou normales utilisées dans l'enseignement - même si celles comme la taille et le poids ne survivent …
Je suis récemment tombé sur le mot «apprentissage par renforcement récurrent». Je comprends ce qu'est un «réseau neuronal récurrent» et ce qu'est un «apprentissage par renforcement», mais je n'ai pas trouvé beaucoup d'informations sur ce qu'est un «apprentissage par renforcement récurrent». Quelqu'un peut-il m'expliquer ce qu'est un «apprentissage par renforcement …
Dans un test de signification statistique des rangs signés de Wilcoxon, nous avons trouvé des données qui produisent une valeur de de . Avec un seuil de , ce résultat est-il suffisant pour rejeter l'hypothèse nulle, ou est-il plus sûr de dire que le test n'était pas concluant, car si …
Wikipedia et la vignette du package sandwich R donnent de bonnes informations sur les hypothèses supportant les erreurs standard des coefficients OLS et le contexte mathématique des estimateurs sandwich. Je ne sais toujours pas comment le problème de l'hétéroscédasticité résiduelle est abordé, probablement parce que je ne comprends pas complètement …
Dans l'approche de l'algorithme EM, nous utilisons l'inégalité de Jensen pour arriver àlogp(x|θ)≥∫logp(z,x|θ)p(z|x,θ(k))dz−∫logp(z|x,θ)p(z|x,θ(k))dzlogp(x|θ)≥∫logp(z,x|θ)p(z|x,θ(k))dz−∫logp(z|x,θ)p(z|x,θ(k))dz\log p(x|\theta) \geq \int \log p(z,x|\theta) p(z|x,\theta^{(k)}) dz - \int \log p(z|x,\theta) p(z|x,\theta^{(k)})dz et définir par \ theta ^ {(k + 1)} = \ arg \ max _ {\ theta} \ int \ log p (z, x | …
Je veux implémenter l'algorithme EM manuellement, puis le comparer aux résultats normalmixEMdu mixtoolspackage. Bien sûr, je serais heureux si les deux aboutissaient aux mêmes résultats. La référence principale est Geoffrey McLachlan (2000), Finite Mixture Models . J'ai une densité de mélange de deux gaussiens, sous forme générale, la log-vraisemblance est …
Existe-t-il un moyen de tester la séparabilité linéaire d'un ensemble de données à deux classes dans des dimensions élevées? Mes vecteurs de caractéristiques mesurent 40 ans. Je sais que je peux toujours exécuter des expériences de régression logistique et déterminer le taux de réussite par rapport au taux de fausse …
Supposons que sont des variables aléatoires continues avec des seconds moments finis. La version démographique du coefficient de corrélation de rang de Spearman ρ_s peut être définie comme le coefficient produit-moment de Pearson ρ des intégrales de probabilité transforme F_X (X) et F_Y (Y) , où F_X, F_Y sont les …
Je ne veux pas savoir si certains phénomènes dans la nature ont une distribution normale, mais si nous pouvons quelque part voir la forme de la courbe normale comme nous pouvons le voir par exemple dans la boîte de Galton. Voir cette figure de Wikipedia. Notez que de nombreuses formes …
Une collègue analyse certaines données biologiques pour sa thèse avec une mauvaise hétéroscédasticité (figure ci-dessous). Elle est en train de l'analyser avec un modèle mixte mais a toujours des problèmes avec les résidus. La transformation logarithmique des variables de réponse nettoie les choses et sur la base des commentaires sur …
Je travaille sur un algorithme qui repose sur le fait que les observations sont normalement distribuées, et je voudrais tester empiriquement la robustesse de l'algorithme à cette hypothèse.OuiOuiY Pour ce faire, je cherchais une suite de transformations qui perturberait progressivement la normalité de . Par exemple, si les sont normaux, …
Breiman dit que les arbres sont cultivés sans élagage. Pourquoi? Je veux dire qu'il doit y avoir une raison solide pour que les arbres de la forêt aléatoire ne soient pas élagués. D'un autre côté, il est considéré comme très important d'élaguer un seul arbre de décision pour éviter un …
J'utilise libsvm en mode C-SVC avec un noyau polynomial de degré 2 et je dois former plusieurs SVM. Chaque ensemble d'entraînement a 10 fonctionnalités et 5000 vecteurs. Pendant la formation, je reçois cet avertissement pour la plupart des SVM que je forme: WARNING: reaching max number of iterations optimization finished, …
Les données pour certains types de variables ont tendance à être anormales lorsqu'elles sont mesurées dans des populations particulières (par exemple, les niveaux de dépression dans une population de personnes souffrant d'un trouble dépressif majeur). Étant donné que Pearson suppose la normalité, quelle est la robustesse de la statistique de …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.