Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'ai utilisé l'imputation multiple pour obtenir un certain nombre de jeux de données terminés. J'ai utilisé des méthodes bayésiennes sur chacun des ensembles de données terminés pour obtenir des distributions postérieures pour un paramètre (un effet aléatoire). Comment puis-je combiner / regrouper les résultats de ce paramètre? Plus de contexte: …
J'utilise la quatrième 1/4transformation de puissance root ( ) sur ma variable de réponse, en raison de l'hétéroscédasticité. Mais maintenant, je ne sais pas comment interpréter mes coefficients de régression. Je suppose que j'aurais besoin de prendre les coefficients à la quatrième puissance lors de la rétrotransformation (voir ci-dessous la …
J'ai été convoqué pour un jury. Je suis conscient de la pertinence des statistiques pour certains procès devant jury. Par exemple, le concept de "taux de base" et son application aux calculs de probabilité est parfois - peut-être toujours - pertinent. Quels sujets statistiques une personne dans ma situation pourrait-elle …
J'ai quelques données qui semblent en traçant un graphique des résidus en fonction du temps presque normal mais je veux en être sûr. Comment puis-je tester la normalité des résidus d'erreur?
Supposons que j'ai 20 souris. J'appaire les souris d'une manière ou d'une autre, de sorte que j'obtienne 10 paires. Aux fins de cette question, il pourrait s'agir d'un appariement aléatoire, OU il pourrait s'agir d'un appariement sensé, comme essayer d'associer des souris de la même portée, du même sexe, avec …
J'ai appris les statistiques bayésiennes et j'ai souvent lu des articles "nous adoptons une approche bayésienne" ou quelque chose de similaire. J'ai aussi remarqué, moins souvent: "nous adoptons une approche entièrement bayésienne" (c'est moi qui souligne). Y a-t-il une différence entre ces approches dans un sens pratique ou théorique? FWIW, …
J'ai 10 ans de données de retours quotidiens pour 28 devises différentes. Je souhaite extraire le premier composant principal, mais plutôt que d'exploiter PCA sur l'ensemble des 10 ans, je souhaite recaler une fenêtre de 2 ans, car les comportements des devises évoluent et je souhaite donc en tenir compte. …
J'ai quelques données en [0,1] que je voudrais analyser avec une régression bêta. Bien sûr, quelque chose doit être fait pour s'adapter aux valeurs 0,1. Je n'aime pas modifier les données pour les adapter à un modèle. Je ne pense pas non plus que l'inflation zéro et 1 soit une …
J'ai du mal à générer un ensemble de séries temporelles colorées stationnaires, étant donné leur matrice de covariance (leurs densités spectrales de puissance (PSD) et leurs densités spectrales de puissance croisée (CSD)). Je sais que, compte tenu de deux séries chronologiques yje( t )yje(t)y_{I}(t) et yJ( t )yJ(t)y_{J}(t) , je …
Une méthode naïve pour approximer une distribution normale consiste à additionner peut-être variables aléatoires IID uniformément réparties sur , puis plus récentes et redimensionnées, en s'appuyant sur le théorème de la limite centrale. ( Remarque : il existe des méthodes plus précises telles que la transformée de Box – Muller …
J'aimerais comprendre comment générer des intervalles de prédiction pour les estimations de régression logistique. On m'a conseillé de suivre les procédures décrites dans Collett's Modeling Binary Data , 2nd Ed p.98-99. Après avoir implémenté cette procédure et l'avoir comparée aux R predict.glm, je pense en fait que ce livre montre …
J'ai quelques questions rapides sur PCA: L'ACP suppose- t-elle que l'ensemble de données est gaussien? Que se passe-t-il lorsque j'applique une PCA à des données intrinsèquement non linéaires? Étant donné un ensemble de données, le processus consiste d'abord à normaliser la moyenne, à définir la variance sur 1, à prendre …
J'ai construit un indice de capital social en utilisant la technique PCA. Cet indice comprend des valeurs à la fois positives et négatives. Je veux transformer / convertir cet index en échelle 0-100 pour le rendre facile à interpréter. Veuillez me suggérer un moyen le plus simple de le faire.
Étant donné un modèle hiérarchique , je veux un processus en deux étapes pour s'adapter au modèle. Tout d'abord, corrigez une poignée d'hyperparamètres , puis faites l'inférence bayésienne sur le reste des paramètres . Pour fixer les hyperparamètres, j'envisage deux options.θ ϕp ( x | ϕ , θ )p(x|ϕ,θ)p(x|\phi,\theta)θθ\thetaϕϕ\phi Utilisez …
J'ai lu diverses déclarations (apparemment) contradictoires, que AdaBoost (ou d'autres techniques de boosting) soient ou non sujettes à un sur-ajustement par rapport à d'autres méthodes d'apprentissage. Y a-t-il de bonnes raisons de croire l'un ou l'autre? Si cela dépend, de quoi dépend-il? Quelles sont les raisons pour lesquelles AdaBoost est …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.