La robustesse en général fait référence à l'insensibilité d'une statistique aux écarts par rapport à ses hypothèses sous-jacentes (Huber et Ronchetti, 2009).
J'ai deux groupes de sujets, A et B, chacun avec une taille d'environ 400 et environ 300 prédicteurs. Mon objectif est de construire un modèle de prédiction pour une variable de réponse binaire. Mon client veut voir le résultat de l'application du modèle construit à partir de A sur B. …
J'essaie de tester la valeur nulle , contre l'alternative locale E [ X ] > 0 , pour une variable aléatoire X , sujette à un biais léger à moyen et à un kurtosis de la variable aléatoire. À la suite des suggestions de Wilcox dans «Introduction to Robust Estimation …
L'ACP robuste (telle que développée par Candes et al 2009 ou mieux encore Netrepalli et al 2014 ) est une méthode populaire pour la détection des valeurs aberrantes multivariées , mais la distance de Mahalanobis peut également être utilisée pour la détection des valeurs aberrantes étant donné une estimation robuste …
Comment ajuster les paramètres d'une distribution t, c'est-à-dire les paramètres correspondant à la «moyenne» et à «l'écart-type» d'une distribution normale. Je suppose qu'ils sont appelés «moyenne» et «échelle / degrés de liberté» pour une distribution t? Le code suivant entraîne souvent des erreurs «échec de l'optimisation». library(MASS) fitdistr(x, "t") Dois-je …
J'ai utilisé des moindres carrés itérativement repondérés (IRLS) pour minimiser les fonctions de la forme suivante, J(m)=∑Ni=1ρ(|xi−m|)J(m)=∑i=1Nρ(|xi−m|)J(m) = \sum_{i=1}^{N} \rho \left(\left| x_i - m \right|\right) où NNN est le nombre d'instances de xi∈Rxi∈Rx_i \in \mathbb{R} , m∈Rm∈Rm \in \mathbb{R} est l'estimation robuste que je veux, et ρρ\rho est une fonction …
L'approche courante pour estimer les paramètres d'une distribution normale consiste à utiliser la moyenne et l'écart-type / variance de l'échantillon. Cependant, s'il y a des valeurs aberrantes, la médiane et l'écart médian par rapport à la médiane devraient être beaucoup plus robustes, non? Sur certains ensembles de données que j'ai …
J'utilise rlm dans le package R MASS pour régresser un modèle linéaire multivarié. Cela fonctionne bien pour un certain nombre d'échantillons, mais j'obtiens des coefficients quasi nuls pour un modèle particulier: Call: rlm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, maxit = 50, na.action …
J'ai un tas (environ 1000) d'estimations et elles sont toutes censées être des estimations de l'élasticité à long terme. Un peu plus de la moitié de ces estimations sont estimées en utilisant la méthode A et le reste en utilisant une méthode B. Quelque part, j'ai lu quelque chose comme …
Certains tests statistiques sont robustes et d'autres non. Que signifie exactement la robustesse? Étonnamment, je n'ai pas pu trouver une telle question sur ce site. De plus, parfois, la robustesse et la puissance d'un test sont discutées ensemble. Et intuitivement, je ne pouvais pas différencier les deux concepts. Qu'est-ce qu'un …
Un collègue de mon bureau m'a dit aujourd'hui "Les modèles d'arbres ne sont pas bons parce qu'ils sont pris par des observations extrêmes". Une recherche ici a abouti à ce fil qui soutient essentiellement la revendication. Ce qui m'amène à la question - dans quelle situation un modèle CART peut-il …
Soit Qn=Cn.{|Xi−Xj|;i<j}(k)Qn=Cn.{|Xi−Xj|;i<j}(k)Q_n = C_n.\{|X_i-X_j|;i < j\}_{(k)} donc pour un échantillon très court comme {1,3,6,2,7,5}{1,3,6,2,7,5}\{1,3,6,2,7,5\} il peut être calculé en trouvant la statique du kkk ème des différences par paires: 7 6 5 3 2 1 1 6 5 4 2 1 2 5 4 3 1 3 4 3 2 …
Je travaille sur les statistiques des builds de logiciels. J'ai des données pour chaque build sur réussite / échec et le temps écoulé et nous générons ~ 200 de ces / semaine. Le taux de réussite est facile à agréger, je peux dire que 45% ont réussi une semaine donnée. …
Des exemples de cette page montrent que la régression simple est nettement affectée par les valeurs aberrantes et cela peut être surmonté par des techniques de régression robuste: http://www.alastairsanderson.com/R/tutorials/robust-regression-in-R/ . Je pense que lmrob et ltsReg sont d'autres techniques de régression robustes. Pourquoi ne devrait-on pas effectuer une régression robuste …
J'emploie l'estimateur habituel de , mais je remarque que mêmepetites valeurs aberrantes « » dans ma distribution empirique,savoirpetits pics loin du centre, affectent énormément. Existe-t-il un estimateur de kurtosis qui est plus robuste?K^=μ^4σ^4K^=μ^4σ^4\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}
J'ai besoin d'adapter une distribution gaussienne généralisée à un nuage de points à 7 dim contenant un nombre assez important de valeurs aberrantes avec un effet de levier élevé. Connaissez-vous un bon package R pour ce travail?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.