Quelqu'un a-t-il de l'expérience avec les approches de sélection du nombre de composants principaux clairsemés à inclure dans un modèle de régression?
Quelqu'un a-t-il de l'expérience avec les approches de sélection du nombre de composants principaux clairsemés à inclure dans un modèle de régression?
Réponses:
Bien que je n'aie pas de vue directe sur votre question, j'ai parcouru certains documents de recherche qui pourraient vous intéresser. C'est, bien sûr, si je comprends bien que vous parlez d' ACP clairsemée , de régression des principaux composants et de sujets connexes. Dans ce cas, voici les papiers:
Les résultats de la validation croisée ont également été utilisés pour déterminer le nombre optimal de dimensions pour l'espace LSI. Trop peu de dimensions n'ont pas profité du pouvoir prédictif des données; alors que trop de dimensions ont entraîné un sur-ajustement. La figure 4 montre la distribution des erreurs moyennes pour les modèles avec différents nombres de dimensions LSI. Les modèles avec des espaces LSI à quatre dimensions ont produit à la fois le nombre moyen d'erreurs le plus faible et le nombre d'erreurs médian le moins élevé, de sorte que le modèle final a été construit en utilisant un espace LSI à quatre dimensions.
Je peux poster une copie si vous n'êtes pas membre d'eeee.
Ceci provient d'un article que j'ai écrit au premier cycle. J'ai eu un problème où je devais décider du nombre de dimensions (l'indexation sémantique latente est similaire à l'ACP) à utiliser dans mon modèle de régression logistique. Ce que j'ai fait, c'est de choisir une métrique (c.-à-d. Le taux d'erreur lors de l'utilisation d'une probabilité d'indicateur de 0,5) et j'ai examiné la distribution de ce taux d'erreur pour différents modèles formés sur différents nombres de dimensions. J'ai ensuite choisi le modèle avec le taux d'erreur le plus bas. Vous pouvez utiliser d'autres mesures comme l'aire sous la courbe ROC.
Vous pouvez également utiliser quelque chose comme une régression pas à pas pour choisir le nombre de dimensions pour vous. Quel type de régression effectuez-vous spécifiquement?
Qu'entendez-vous par btw clairsemé?