J'ai une question concernant la technique d'amorçage appropriée à utiliser avec des données où un clustering puissant est présent. J'ai été chargé d'évaluer un modèle prédictif multivarié à effets mixtes sur les données de sinistres d'assurance en notant le modèle de référence actuel sur les données de sinistres plus récentes, …
Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test non paramétrique comme Mann-Whitney-U-testcela entraînerait la perte …
Je suis relativement nouveau dans les statistiques. Le concept de bootstrapping m'a dérouté. Je sais que la normalité de la distribution d'échantillonnage est requise pour utiliser certains tests tels que le test t. Dans les cas où les données ne sont pas normalement distribuées, en demandant le "bootstrapping" dans les …
"Validation Bootstrap" / "validation croisée de rééchantillonnage" est nouveau pour moi, mais a été discuté par la réponse à cette question . Je suppose que cela implique 2 types de données: les données réelles et les données simulées, où un ensemble donné de données simulées est généré à partir des …
Lors de l'utilisation du bootstrap pour l'évaluation de modèles, j'ai toujours pensé que les échantillons hors sac étaient directement utilisés comme ensemble de test. Cependant, cela ne semble pas être le cas pour l' approche obsolète de scikit-learnBootstrap , qui semble construire l'ensemble de test à partir d'un dessin avec …
Je voulais juste vous demander quels sont, selon vous, les meilleurs livres disponibles sur le bootstrap. Par cela, je ne veux pas nécessairement dire celui écrit par ses développeurs. Pourriez-vous s'il vous plaît indiquer quel manuel est selon vous le meilleur pour le bootstrap qui couvre les critères suivants? La …
Supposons que l'on effectue le bootstrap dit non paramétrique en tirant échantillons de taille n chacun à partir des n observations originales avec remplacement. Je crois que cette procédure équivaut à estimer la fonction de distribution cumulative par le cdf empirique:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function puis obtenir les échantillons de bootstrap en simulant …
Je lis le chapitre sur les statistiques fréquentes du livre de Kevin Murphy " Machine Learning - A Probabilistic Perspective ". La section sur le bootstrap se lit comme suit: Le bootstrap est une technique Monte Carlo simple pour approximer la distribution d'échantillonnage. Ceci est particulièrement utile dans les cas …
J'ai du mal à comprendre comment utiliser le bootstrap pour calculer les intervalles de prédiction pour un modèle de régression linéaire. Quelqu'un peut-il décrire une procédure étape par étape? J'ai cherché via google mais rien n'a vraiment de sens pour moi. Je comprends comment utiliser le bootstrap pour calculer les …
Je cherchais récemment des moyens de rééchantillonner des séries chronologiques, Préserve approximativement l'auto-corrélation des longs processus de mémoire. Préserver le domaine des observations (par exemple une série temporelle rééchantillonnée d'entiers est toujours une série temporelle d'entiers). Peut affecter certaines échelles uniquement, si nécessaire. J'ai trouvé le schéma de permutation suivant …
Je veux savoir si le processus décrit ci-dessous est valide / acceptable et toute justification disponible. L'idée: les algorithmes d'apprentissage supervisé ne supposent pas de structures / distributions sous-jacentes sur les données. À la fin de la journée, ils produisent des estimations ponctuelles. J'espère quantifier en quelque sorte l'incertitude des …
J'ai un vecteur de nombres que j'ai téléchargé ici (... / code / MyData.Rdata) en utilisant dput. Je voudrais obtenir le bca ci donc j'ai écrit ce code: my.mean <- function(dat, idx){ return (mean(dat[idx], na.rm = TRUE)) } boot.out<-boot(data=my.data, statistic = my.mean, R=1000) Mais quand je lance ce qui suit, …
Si vous ne faites que rééchantillonner à partir de la distribution empirique, pourquoi ne pas simplement étudier la distribution empirique? Par exemple, au lieu d'étudier la variabilité par échantillonnage répété, pourquoi ne pas simplement quantifier la variabilité à partir de la distribution empirique?
J'essaie actuellement de comprendre certaines choses concernant le bootstrap paramétrique. La plupart des choses sont probablement insignifiantes, mais je pense toujours avoir raté quelque chose. Supposons que je souhaite obtenir des intervalles de confiance pour les données à l'aide d'une procédure d'amorçage paramétrique. J'ai donc cet échantillon et je suppose …
Si, dans les régressions OLS standard, deux hypothèses sont violées (distribution normale des erreurs, homoscédasticité), l'amorçage des erreurs standard et des intervalles de confiance est-il une alternative appropriée pour obtenir des résultats significatifs en ce qui concerne la signification des coefficients du régresseur? Les tests de signification avec des erreurs …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.