J'ai besoin d'adapter une distribution gaussienne généralisée à un nuage de points à 7 dim contenant un nombre assez important de valeurs aberrantes avec un effet de levier élevé. Connaissez-vous un bon package R pour ce travail?
J'ai besoin d'adapter une distribution gaussienne généralisée à un nuage de points à 7 dim contenant un nombre assez important de valeurs aberrantes avec un effet de levier élevé. Connaissez-vous un bon package R pour ce travail?
Réponses:
Il y a aussi mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html
Une mise en garde cependant: la modélisation de mélange dans un espace de grande dimension peut consommer beaucoup de CPU et de mémoire si votre nuage de points est grand. Il y a environ quatre ans, je faisais un lot de données en 11 dimensions, 50-200K points, et cela avait tendance à fonctionner avec 4 à 11 Go de RAM et à prendre jusqu'à une semaine pour calculer pour chaque cas (et j'en avais 400). C'est certainement possible, mais cela peut être un casse-tête si vous utilisez un cluster de calcul partagé ou si les ressources disponibles sont limitées.
Cela ressemble à un modèle de mélange gaussien multivarié classique. Je pense que le paquet BayesM pourrait fonctionner.
Voici quelques packages de mélanges gaussiens multivariés