J'ai récemment utilisé l'amorçage pour estimer les intervalles de confiance d'un projet. Quelqu'un qui ne connaît pas grand chose aux statistiques m'a récemment demandé d'expliquer pourquoi l' amorçage fonctionne, c.-à-d. Pourquoi le rééchantillonnage répétitif du même échantillon donne-t-il de bons résultats. J'ai réalisé que bien que j'avais passé beaucoup de …
Ici @gung fait référence à la règle .632+. Une recherche rapide dans Google ne permet pas de comprendre aisément ce que cette règle signifie et dans quel but elle est utilisée. Quelqu'un voudrait-il élucider la règle .632+?
J'aimerais connaître votre avis sur les différences entre la validation croisée et l’amorçage pour estimer l’erreur de prédiction. Est-ce qu'on travaille mieux pour de petites tailles de données ou de grands ensembles de données?
Supposons que je dispose d’un ensemble d’échantillons de données d’une distribution inconnue ou complexe et que je veuille effectuer une inférence sur une statistique TTT des données. Mon inclinaison par défaut est de simplement générer un tas d'échantillons bootstrap avec le remplacement, et calculer ma statistique TTT sur chaque échantillon …
Je commence à me familiariser avec l’utilisation de glmnetavec LASSO Regression, où mon résultat d’intérêt est dichotomique. J'ai créé un petit cadre de données fictif ci-dessous: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
J'essaie de comprendre la différence entre différentes méthodes de rééchantillonnage (simulation de Monte Carlo, amorçage paramétrique, amorçage non paramétrique, jackknifing, validation croisée, tests de randomisation et de permutation) et leur mise en œuvre dans mon propre contexte en utilisant R. Disons que j'ai la situation suivante - je veux effectuer …
Cette question a été déclenchée par quelque chose que j'ai lu dans ce manuel de statistiques de deuxième cycle et que j'ai entendu (indépendamment) lors de cette présentation lors d'un séminaire statistique. Dans les deux cas, la déclaration était dans les lignes de "parce que la taille de l'échantillon est …
J'apprécie l'utilité du bootstrap pour obtenir des estimations de l'incertitude, mais une chose qui m'a toujours dérangé à ce sujet est que la distribution correspondant à ces estimations est la distribution définie par l'échantillon. En général, il semble être une mauvaise idée de croire que nos fréquences d'échantillonnage ressemblent exactement …
Les méthodes bootstrap et jackknife peuvent être utilisées pour estimer le biais et l’erreur type d’une estimation et les mécanismes des deux méthodes de ré-échantillonnage ne sont pas très différents: échantillonnage avec remplacement ou omission d’une observation à la fois. Toutefois, le jackknife n’est pas aussi populaire que le bootstrap …
Je me demande si cela fait une différence d'interprétation si seules les variables dépendantes, indépendantes et dépendantes, ou uniquement les variables indépendantes sont transformées par un journal. Considérons le cas de log(DV) = Intercept + B1*IV + Error Je peux interpréter l'IV comme l'augmentation en pourcentage, mais comment cela change-t-il …
Ok, c'est une question qui me tient éveillé la nuit. La procédure de bootstrap peut-elle être interprétée comme une approximation de certaines procédures bayésiennes (à l’exception du bootstrap bayésien)? J'aime beaucoup «l'interprétation» bayésienne des statistiques, que je trouve bien cohérente et facile à comprendre. Cependant, j’ai également un faible pour …
Je courir à travers l'affirmation selon laquelle chaque échantillon de bootstrap (ou un arbre mis en sac) contiennent en moyenne environ 2/32/32/3 des observations. Je comprends que la chance de ne pas être sélectionné dans l' un des nnn tire de nnn échantillons avec le remplacement est (1−1/n)n(1−1/n)n(1- 1/n)^n , …
Je suis intéressé par la détermination du nombre de régularités significatives issues d'une analyse en composantes principales (ACP) ou d'une fonction empirique orthogonale (EOF). Je suis particulièrement intéressé par l'application de cette méthode aux données climatiques. Le champ de données est une matrice MxN, M étant la dimension temporelle (par …
Je me demande si quelqu'un connaît des règles générales concernant le nombre d'échantillons bootstrap à utiliser, en fonction des caractéristiques des données (nombre d'observations, etc.) et / ou des variables incluses?
J'ai consulté de nombreuses questions sur ce site concernant l'amorçage et les intervalles de confiance, mais je suis toujours confus. Une partie de la raison de ma confusion tient probablement au fait que mes connaissances en statistiques ne sont pas suffisamment avancées pour comprendre un grand nombre de réponses. Je …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.