(La réponse ci-dessous ne fait qu'introduire et énoncer le théorème prouvé dans [0]. La beauté de cet article est que la plupart des arguments sont faits en termes d'algèbre linéaire de base. Pour répondre à cette question, il suffira d'énoncer les principaux résultats mais par tous les moyens, allez vérifier la source d'origine).
Dans toute situation où le modèle multivarié des données peut être décrit par une distribution elliptique à variables, l'inférence statistique réduira, par définition, le problème de l'ajustement (et de la caractérisation) d'un vecteur de localisation à k variables (disons θ ) et d'un par matrice définie semi-positive symétrique (disons ) aux données. Pour des raisons que j'explique ci-dessous (mais que vous supposez déjà comme prémisses), il sera souvent plus significatif de décomposer en un composant de forme (une matrice SPSD de la même taille quekkθk Σ Σ Σ σ SkkΣΣΣ) tenant compte de la forme des contours de densité de votre distribution multivariée et d'un scalaire exprimant l'échelle de ces contours.σS
Dans les données univariées ( ), , la matrice de covariance de vos données est un scalaire et, comme nous le verrons ci-dessous, la composante de forme de est 1 de sorte que est égal à son composant d'échelle toujours et aucune ambiguïté n'est possible.Σ Σ Σ Σ = σ Sk=1ΣΣΣΣ=σS
Dans les données multivariées, de nombreux choix de fonctions d'échelle sont possibles. Un en particulier ( ) se distingue par une propriété clé souhaitable. Cela devrait en faire le choix préféré du facteur d'échelle dans le contexte des familles elliptiques.σ S = | ΣσSσS=|ΣΣ|1/k
De nombreux problèmes dans les statistiques MV impliquent l'estimation d'une matrice de dispersion, définie comme une fonction (al)
symétrique semi-définie définie dans et satisfaisante:R k × kΣRk×k
(0)Σ(AX+b)=AΣ(X)A⊤
(pour matrices non singulières et vecteurs ). Par exemple, l'estimation classique de la covariance satisfait (0) mais elle n'est en aucun cas la seule.
bAb
En présence de données réparties elliptiques, où tous les contours de densité sont des ellipses définies par la même matrice de forme, jusqu'à la multiplication par un scalaire, il est naturel de considérer des versions normalisées de de la forme:Σ
VS=Σ/S(Σ)
où est une fonction 1-homogène satisfaisant:S
(1)S(λΣ)=λS(Σ)
pour tout . Ensuite, V S est appelé le composant de forme de la matrice de dispersion (dans une matrice de forme courte) et σ S = S 1 / deux ( Σ ) est appelé le composant à l'échelle de la matrice de dispersion. Des exemples de problèmes d'estimation multivariée où la fonction de perte ne dépend que de Σ à travers sa composante de forme V S incluent des tests de sphéricité, PCA et CCA entre autres.λ>0VSσS=S1/2(Σ)ΣVS
Bien sûr, il existe de nombreuses fonctions d'échelle possibles, ce qui laisse toujours ouverte la question de savoir si (le cas échéant) plusieurs choix de fonction de normalisation sont en quelque sorte optimaux. Par exemple:S
- (par exemple celui proposé par @amoeba dans son commentaire sous la question du PO. Voir aussi [1], [2], [3])S=tr(Σ)/k
- ([4], [5], [6], [7], [8])S=|Σ|1/k
- (la première entrée de la matrice de covariance)Σ11
- (la première valeur propre de Σ )λ1( Σ)Σ
Cependant, est la seule fonction d'échelle pour laquelle la matrice d'informations de Fisher pour les estimations correspondantes d'échelle et de forme, dans des familles localement asymptotiquement normales, est diagonale par blocs (c'est-à-dire que les composantes d'échelle et de forme du problème d'estimation sont asymptotiquement orthogonales) [0 ]. Cela signifie, entre autres, que l'échelle fonctionnelle S = | Σ | 1 / k est le seul choix de S pour lequel la spécification de non σ S ne provoque pas de perte d'efficacité lors de l' exécution sur l' inférence V S .S= | Σ|1 / kS= | Σ|1 / kSσSVS
Je ne connais aucune caractérisation d'optimalité comparable pour aucun des nombreux choix possibles de qui satisfont (1).S
- [0] Paindaveine, D., Une définition canonique de la forme, Statistics & Probability Letters, Volume 78, Numéro 14, 1er octobre 2008, Pages 2240-2247. Lien non fermé
- [1] Dumbgen, L. (1998). Sur la fonction M de Tyler de la dispersion en haute dimension, Ann. Inst. Statist. Math. 50, 471–491.
- [2] Ollila, E., TP Hettmansperger et H. Oja (2004). Méthodes de signe multivariées équivariées affines. Preprint, Université de Jyvaskyla.
- [3] Tyler, DE (1983). Propriétés de robustesse et d'efficacité des matrices de diffusion, Biometrika 70, 411–420.
- [4] Dumbgen, L. et DE Tyler (2005). Sur les propriétés de répartition de certaines fonctions M multivariées, Scand. J. Statist. 32, 247-264.
- [5] Hallin, M. et D. Paindaveine (2008). Tests optimaux basés sur le rang pour l'homogénéité de la diffusion, Ann. Statist., À paraître.
- [6] Salibian-Barrera, M., S. Van Aelst et G. Willems (200 6). Analyse en composantes principales basée sur des estimateurs MM multivariés avec bootstrap rapide et robuste, J. Amer. Statist. Assoc. 101, 1198-1211.
- [7] Taskinen, S., C. Croux, A. Kankainen, E. Ollila et H. O ja (2006). Influencer les fonctions et l'efficacité de la corrélation canonique et des estimations vectorielles basées sur les matrices de dispersion et de forme, J. Multivariate Anal. 97, 359–384.
- [8] Tatsuoka, KS et DE Tyler (2000). Sur l'unicité des fonctions S et des fonctions M dans les distributions non elliptiques, Ann. Statist. 28, 1219-1243.