Moi-même, j'utiliserais toujours la moyenne géométrique pour estimer une médiane lognormale. Cependant, dans le monde de l'industrie, l'utilisation de la médiane de l'échantillon donne parfois de meilleurs résultats. La question est donc la suivante: existe-t-il un intervalle / point de coupure à partir duquel la médiane de l'échantillon peut être utilisée de manière fiable comme estimateur de la médiane de la population?
De plus, la moyenne géométrique de l'échantillon est MLE pour la médiane, mais non sans biais. Un estimateur non biaisé serait siest connu. En pratique, un estimateur corrigé biaisé (voir ci-dessous) est utilisé depuis est toujours inconnu. Il existe des articles qui disent que cet estimateur géoméen à biais corrigé est meilleur en raison d'une plus petite MSE et d'un caractère non biaisé. Cependant, en réalité, lorsque nous n'avons qu'un échantillon de 4 à 6, puis-je affirmer que la correction du biais n'a aucun sens puisque
- L'impartialité signifie que l'estimateur est centré sur le vrai paramètre de population, ni sous ni surestimé le paramètre. Pour une distribution asymétrique positive, le centre est la médiane et non la moyenne.
- Invariant à la transformation est une propriété importante dans mon domaine actuel (transformation entre DT50 et taux de dégradation k, k = log (2) / DT50). Vous obtiendrez des résultats différents en fonction des données d'origine et des données transformées.
- Pour une taille d'échantillon limitée, l'impartialité moyenne est potentiellement trompeuse. Le biais n'est pas une erreur, un estimateur non biaisé peut donner une plus grande erreur. D'un point de vue bayésien, les données sont connues et fixes, le MLE maximise la probabilité d'observer les données, tandis que la correction de biais est basée sur des paramètres fixes.
L'estimateur géométrique moyen de l'échantillon est MLE, sans biais médian, invariant aux transformations. Je pense qu'il devrait être préféré à l'estimateur géoméen à biais corrigé. Ai-je raison?
Assuming
où, et sont le log-mean et log-sd, et sont les MLE pour et .
Une question connexe: pour la variance de la médiane de l'échantillon, il existe une formule approximative ; quelle est une taille d'échantillon suffisamment grande pour utiliser cette formule?