Doit-on toujours s'attendre à ce que la tendance centrale (c.-à-d. La moyenne et / ou la médiane) d'un échantillon bootstrap soit similaire à la valeur observée? Dans ce cas particulier, j'ai des réponses qui sont distribuées de façon exponentielle pour les sujets dans deux conditions (je n'ai pas exécuté l'expérience, …
Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle se monthly spendtrouve la variable …
Je suis venu par plusieurs articles et documents affirmant que l'élagage des arbres dans un ensemble d'arbres "ensachés" n'était pas nécessaire (voir 1 ). Cependant, est-ce nécessairement (ou du moins dans certains cas connus) dommageable d'effectuer l'élagage (par exemple, avec l'échantillon OOB) sur les arbres individuels dans un ensemble? Merci!
Il y a quelque temps, j'ai posé une question sur la corrélation des temps entre les horodatages et j'ai reçu une réponse de Peter Ellis qui m'a dit que je pouvais calculer les distances moyennes entre les codes ... Cela vous donnera déjà une idée des comportements qui sont regroupés, …
Je suis tombé sur un nouvel article du groupe Berkeley NLP sur les tests statistiques, An Empirical Investigation of Statistical Significance in NLP . Il existe un pseudocode pour calculer une valeur de p dans le papier, en gros, l'idée est que l'ensemble d'échantillons de X1,X2, . . . ,XNx1,x2,...,xNx_1,x_2,...,x_N …
Ma compréhension de l'approche bootstrap est basée sur le cadre de Wasserman (presque mot pour mot): Soit une statistique ( est l'échantillon iid tiré de la distribution ). Supposons que nous voulons estimer - la variance de donné .Tn=g(X1,...,Xn)Tn=g(X1,...,Xn)T_n = g(X_1, ..., X_n)XiXiX_iFFFVF(Tn)VF(Tn)V_F(T_n)TnTnT_nFFF L'approche bootstrap suit ces deux étapes: Estimer …
Il est connu que le bootstrap peut échouer. J'ai lu dans la section 6 de Bickel et Freedman (1981) que le bootstrap échoue lorsque vous voulez l'utiliser pour évaluer le MLE pour estimer le paramètre d'une distribution uniforme continue. J'ai lu la section 7.4 du livre d'Efron et Tibshirani, mais …
Disons que j'ai collecté un petit nombre (N) d'observations pour une hypothèse que j'aimerais tester. Je pourrais utiliser la méthode bootstrap pour produire une distribution d'échantillon pour le résultat moyen de N observations, mais je crains que ce modèle ne se décompose lorsque N devient très petit, introduisant une erreur …
Le contexte: Dans le cadre de la modélisation d'équations structurelles, j'ai une non-normalité selon le test de Mardia mais les indices univariés d'asymétrie et de kurtosis sont inférieurs à 2,0. Des questions: Les estimations des paramètres (estimations des coefficients) devraient-elles être évaluées en utilisant le bootstrap (1000 répétitions) avec des …
J'ai un fichier assez volumineux de 100 millions de lignes et 30 colonnes environ, sur lequel j'aimerais exécuter plusieurs régressions. J'ai un code spécialisé pour exécuter les régressions sur l'ensemble du fichier, mais ce que je voudrais faire est de tirer des échantillons aléatoires du fichier et de les exécuter …
J'ai un ensemble de données où je dois faire une régression linéaire. Malheureusement, il existe un problème d'hétéroscédasticité. J'ai relancé l'analyse en utilisant une régression robuste avec l'estimateur HC3 pour la variance et j'ai également effectué un bootstrap avec la fonction bootcov dans Hmisc pour R. Les résultats sont assez …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.