Dans un ensemble de données de deux populations qui ne se chevauchent pas (patients et en bonne santé, total ), je voudrais trouver (sur variables indépendantes) des prédicteurs significatifs pour une variable dépendante continue. Il existe une corrélation entre les prédicteurs. Je voudrais savoir si l'un des prédicteurs est lié à la variable dépendante "en réalité" (plutôt que de prédire la variable dépendante aussi exactement que possible). Comme j'ai été submergé par les nombreuses approches possibles, je voudrais demander quelle approche est la plus recommandée.300
D'après ma compréhension, l'inclusion ou l'exclusion progressive des prédicteurs n'est pas recommandée
Par exemple, exécuter une régression linéaire séparément pour chaque prédicteur et corriger les valeurs de p pour une comparaison multiple à l'aide du FDR (probablement très conservateur?)
Régression en composantes principales: difficile à interpréter car je ne pourrai pas parler du pouvoir prédictif des prédicteurs individuels mais uniquement des composants.
d'autres suggestions?