Généralisation de la distribution et de la classification normales multivariées


8

Je m'intéresse à une famille de distributions multivariées qui peut être vue comme une généralisation de la distribution normale multivariée, dans la mesure où elles sont définies par une valeur d'espérance μ et une matrice de covariance Σ, plus une fonction décroissante monotone g() de telle sorte que la densité est

p(X)g(Δ(X,μ))
Δ(une,b)=(une-b)TΣ-1(une-b)
est la distance de Mahalanobis. La normale multivariée est bien sûr récupérée parg()=exp(-122).

Ma première question est: quel est le nom de cette famille de distributions?

Il est simple de montrer que pour la classification d'une donnée donnée, pointez sur une ou deux classes ou plus, chacune étant décrite par une telle densité avec des μ mais identique Σ et g(), les limites de classification optimales sont linéaires par morceaux (hyperplanaires).

Ma deuxième question est: est-ce un résultat standard, et si oui, quelle est la référence standard de la littérature (manuel) pour cela?


5
À ma connaissance, il existe deux familles de distributions liées à votre description: 1. Les distributions elliptiques et 2. Les distributions sphériques .

Salut @Procrastinator, ça fait bizarre de voir son post édité par quelqu'un d'autre, mais je comprends votre point. - Quant à votre commentaire, je crois que les distributions elliptiques sont exactement ce que je veux dire, et les distributions sphériques sont un cas spécial. Je pense donc que ce que vous avez écrit n'est pas un commentaire mais une réponse. Merci beaucoup! - En utilisant la nouvelle terminologie, une recherche pour son utilisation dans la classification n'a toujours rien donné, donc ma deuxième question est toujours ouverte.
A. Donda

Réponses:


2

La réponse à la première question a été donnée par Procrastinator dans un commentaire: La famille s'appelle Elliptical Distributions . La référence standard du manuel semble être

Fang, K., Kotz, S., Ng, KW, 1990. Distributions symétriques multivariées et connexes. Chapman et Hall.

En ce qui concerne la deuxième question , il apparaît que la plupart des publications sur la classification considèrent soit des distributions normales multivariées soit des procédures complètement non paramétriques. J'ai cependant trouvé une publication qui compare les algorithmes de classification basés sur différents estimateurs deμ et Σ, et le fait dans le contexte des distributions elliptiques:

Hartikainen, A., Oja, H., 2006. Sur certaines règles de discrimination paramétriques, non paramétriques et semi-paramétriques, dans: Profondeur des données: analyse multivariée robuste, géométrie computationnelle et applications. American Mathematical Society, p. 61–70.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.