Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
La différence des différences a longtemps été populaire en tant qu'outil non expérimental, en particulier en économie. Quelqu'un peut-il fournir une réponse claire et non technique aux questions suivantes sur les différences dans les différences. Qu'est-ce qu'un estimateur de différence dans la différence? Pourquoi un estimateur de différence de différence …
En gros, une valeur-p donne une probabilité du résultat observé d'une expérience étant donné l'hypothèse (modèle). Ayant cette probabilité (valeur p), nous voulons juger notre hypothèse (quelle est sa probabilité). Mais ne serait-il pas plus naturel de calculer la probabilité de l'hypothèse en fonction du résultat observé? En plus de …
Je m'enseigne moi-même sur l'apprentissage par renforcement et j'essaie de comprendre le concept de récompense actualisée. La récompense est donc nécessaire pour indiquer au système quelles paires d’État-action sont bonnes et lesquelles sont mauvaises. Mais ce que je ne comprends pas, c'est pourquoi la récompense à prix réduit est nécessaire. …
Je suis récemment tombé sur cette identité: E[E(Y|X,Z)|X]=E[Y|X]E[E(Y|X,Z)|X]=E[Y|X]E \left[ E \left(Y|X,Z \right) |X \right] =E \left[Y | X \right] Je suis bien sûr familier avec la version simplifiée de cette règle, à savoir que mais je n’ai pas pu trouver de justification pour sa généralisation.E[E(Y|X)]=E(Y)E[E(Y|X)]=E(Y)E \left[ E \left(Y|X \right) \right]=E …
J'écris actuellement un article avec plusieurs analyses de régression multiple. Bien que la visualisation de la régression linéaire univariée soit facile via les diagrammes de dispersion, je me demandais s’il existait un bon moyen de visualiser plusieurs régressions linéaires? Je ne fais que tracer des diagrammes de dispersion comme variable …
Quand je lis "moyenne mobile" par rapport à une série chronologique, je pense quelque chose comme , ou peut-être une pondérée moyenne comme . (Je réalise que ce sont en fait des modèles AR (3), mais ce sont les choses auxquelles mon cerveau se lance.) Pourquoi les modèles de modèles …
Ok, c'est une question qui me tient éveillé la nuit. La procédure de bootstrap peut-elle être interprétée comme une approximation de certaines procédures bayésiennes (à l’exception du bootstrap bayésien)? J'aime beaucoup «l'interprétation» bayésienne des statistiques, que je trouve bien cohérente et facile à comprendre. Cependant, j’ai également un faible pour …
Ma question concerne l’essai de justifier une méthode largement utilisée, à savoir la valeur attendue de Taylor Series. Supposons que nous avons une variable aléatoire avec une moyenne positive et une variance . De plus, nous avons une fonction, disons .XXXμμ\muσ2σ2\sigma^2log(x)log(x)\log(x) Faire Taylor l'expansion de autour de la moyenne, nous …
Je suis novice dans l'exploration de données et j'essaie de former un arbre de décision par rapport à un ensemble de données extrêmement déséquilibré. Cependant, j'ai des problèmes avec une faible précision prédictive. Les données comprennent les étudiants qui étudient les cours, et la variable de classe est le statut …
J'ai lu / entendu à plusieurs reprises que la taille d'échantillon d'au moins 30 unités est considérée comme un "échantillon large" (les hypothèses de normalité des moyennes sont généralement à peu près valables en raison du CLT, ...). Par conséquent, dans mes expériences, je génère généralement des échantillons de 30 …
Je songe à construire un modèle prédisant un rapport , où et et . Le rapport serait donc compris entre et .a / bune/ba/ba ≤ bune≤ba \le ba > 0une>0a > 0b > 0b>0b > 0000111 Je pourrais utiliser la régression linéaire, bien qu'elle ne soit pas naturellement limitée à …
La régularisation à l'aide de méthodes telles que Ridge, Lasso, ElasticNet est assez courante pour la régression linéaire. Je voulais savoir ce qui suit: Ces méthodes sont-elles applicables à la régression logistique? Si tel est le cas, existe-t-il des différences dans la manière dont ils doivent être utilisés pour la …
Quelqu'un peut-il expliquer ce que font les unités maxout d'un réseau de neurones? Comment fonctionnent-ils et en quoi diffèrent-ils des unités conventionnelles? J'ai essayé de lire le document "Maxout Network" de Goodfellow et al. (du groupe du professeur Yoshua Bengio), mais je ne comprends pas très bien.
Quelle est la principale différence entre l'estimation du maximum de vraisemblance (EVM) et l'estimation par la méthode des moindres carrés (EVC)? Pourquoi ne pouvons-nous pas utiliser MLE pour prédire les valeurs dans la régression linéaire et inversement?yyy Toute aide sur ce sujet sera grandement appréciée.
J'utilise principalement "distribution gaussienne" dans mon livre, mais quelqu'un vient de suggérer que je passe à "distribution normale". Un consensus sur quel terme utiliser pour les débutants? Bien sûr, les deux termes sont des synonymes , il ne s'agit donc pas d'une question de fond, mais uniquement du terme le …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.