Toutes mes excuses à l'avance si l'une des terminologies que j'utilise est incorrecte. J'accueillerais toute correction. Si ce que je décris comme une «coupure» porte un nom différent, faites-le moi savoir et je pourrai mettre à jour la question.
La situation qui m'intéresse est la suivante: vous avez des variables indépendantes et une seule variable dépendante . Je vais laisser les choses vagues, mais supposons qu'il serait relativement simple d'obtenir un bon modèle de régression pour ces variables. y
Cependant, le modèle que vous souhaitez créer concerne les variables indépendantes et la variable dépendante , où est une valeur fixe dans la plage de . De même, les données auxquelles vous avez accès n'incluent pas , seulement .
Un exemple (quelque peu irréaliste) serait si vous essayez de modéliser le nombre d'années pendant lesquelles les gens toucheront leur pension. Dans ce cas, pourrait être des informations pertinentes telles que le sexe, le poids, les heures d'exercice par semaine, etc. La variable «sous-jacente» serait l'espérance de vie. Cependant, la variable à laquelle vous auriez accès et que vous essayez de prédire dans votre modèle serait où r est l'âge de la retraite (en supposant, pour des raisons de simplicité, qu'il est fixe).
Existe-t-il une bonne approche pour gérer cela dans la modélisation de régression?