J'ai un tas (environ 1000) d'estimations et elles sont toutes censées être des estimations de l'élasticité à long terme. Un peu plus de la moitié de ces estimations sont estimées en utilisant la méthode A et le reste en utilisant une méthode B. Quelque part, j'ai lu quelque chose comme "Je pense que la méthode B estime quelque chose de très différent de la méthode A, parce que les estimations sont beaucoup plus élevées (50-60%) ". Ma connaissance des statistiques robustes est presque nulle, donc je n'ai calculé que les moyennes et les médianes des deux échantillons ... et j'ai immédiatement vu la différence. La méthode A est très concentrée, la différence entre la médiane et la moyenne est très faible, mais l'échantillon de la méthode B variait énormément.
J'ai conclu que les valeurs aberrantes et les erreurs de mesure faussent l'échantillon de la méthode B, j'ai donc jeté environ 50 valeurs (environ 15%) qui étaient très incompatibles avec la théorie ... et tout à coup, les moyennes des deux échantillons (y compris leur IC) étaient très similaires . La densité trace également.
(Dans le but d'éliminer les valeurs aberrantes, j'ai regardé la plage de l'échantillon A et supprimé tous les points d'échantillonnage de B qui se situaient en dehors de celui-ci.) J'aimerais que vous me disiez où je pourrais trouver des bases d'une estimation robuste des moyens qui permettez-moi de juger cette situation plus rigoureusement. Et d'avoir quelques références. Je n'ai pas besoin d'une compréhension très approfondie des différentes techniques, mais plutôt de lire une étude complète de la méthodologie d'estimation robuste.
J'ai testé la signification de la différence moyenne après la suppression des valeurs aberrantes et la valeur de p est de 0,0559 (t autour de 1,9), pour les échantillons complets, la stat t était d'environ 4,5. Mais ce n'est pas vraiment le point, les moyens peuvent être un peu différents, mais ils ne devraient pas différer de 50 à 60% comme indiqué ci-dessus. Et je ne pense pas qu'ils le fassent.