J'utilise Lasso pour la sélection d'entités dans un cadre dimensionnel relativement bas (n >> p). Après avoir ajusté un modèle Lasso, je veux utiliser les covariables avec des coefficients non nuls pour ajuster un modèle sans pénalité. Je fais cela parce que je veux des estimations impartiales que Lasso ne peut pas me donner. Je voudrais également des valeurs de p et des intervalles de confiance pour l'estimation non biaisée.
J'ai du mal à trouver de la littérature sur ce sujet. La plupart de la littérature que je trouve concerne l'imposition d'intervalles de confiance aux estimations de Lasso, et non un modèle réajusté.
D'après ce que j'ai lu, le simple réaménagement d'un modèle à l'aide de l'ensemble de données conduit à des valeurs p / valeurs std irréalistes. À l'heure actuelle, le fractionnement des échantillons (dans le style de Wasserman et Roeder (2014) ou Meinshausen et al. (2009)) semble être une bonne ligne de conduite, mais je cherche plus de suggestions.
Quelqu'un a-t-il rencontré ce problème? Si oui, pourriez-vous s'il vous plaît fournir quelques suggestions.