J'essaie de tester la valeur nulle , contre l'alternative locale E [ X ] > 0 , pour une variable aléatoire X , sujette à un biais léger à moyen et à un kurtosis de la variable aléatoire. À la suite des suggestions de Wilcox dans «Introduction to Robust Estimation and Hypothesis Testing», j'ai examiné des tests basés sur la moyenne ajustée, la médiane, ainsi que l'estimateur M de la localisation (procédure «en une étape» de Wilcox). Ces tests robustes surpassent le test t standard, en termes de puissance, lors d'un test avec une distribution non asymétrique, mais leptokurtotique.
Cependant, lors de tests avec une distribution asymétrique, ces tests unilatéraux sont soit beaucoup trop libéraux soit beaucoup trop conservateurs dans l'hypothèse nulle, selon que la distribution est asymétrique à gauche ou à droite, respectivement. Par exemple, avec 1000 observations, le test basé sur la médiane rejettera réellement ~ 40% du temps, au niveau nominal de 5%. La raison en est évidente: pour les distributions asymétriques, la médiane et la moyenne sont assez différentes. Cependant, dans ma demande, j'ai vraiment besoin de tester la moyenne, pas la médiane, pas la moyenne ajustée.
Existe-t-il une version plus robuste du test t qui teste réellement la moyenne, mais est imperméable à l'inclinaison et au kurtosis?
Idéalement, la procédure fonctionnerait bien dans le cas de non-biais et de kurtosis élevé. Le test «en une étape» est presque suffisant, le paramètre «pliage» étant relativement élevé, mais il est moins puissant que les tests de moyenne ajustée lorsqu'il n'y a pas d'asymétrie et a quelques difficultés à maintenir le niveau nominal de rejets sous asymétrie. .
Contexte: la raison pour laquelle je me soucie vraiment de la moyenne, et non de la médiane, est que le test serait utilisé dans une application financière. Par exemple, si vous vouliez tester si un portefeuille avait des rendements logarithmiques attendus positifs, la moyenne est en fait appropriée car si vous investissez dans le portefeuille, vous ressentirez tous les rendements (qui sont la moyenne multipliée par le nombre d'échantillons), au lieu de doublons de la médiane. C'est, je me soucie vraiment de la somme des n tire de la RV X .