Je travaille sur un devoir où mon professeur aimerait que nous créons un vrai modèle de régression, simulons un échantillon de données et il va essayer de trouver notre vrai modèle de régression en utilisant certaines des techniques que nous avons apprises en classe. Nous devrons également faire de même avec un ensemble de données qu'il nous a donné.
Il dit qu'il a été en mesure de produire un modèle assez précis pour toutes les tentatives passées pour essayer de le tromper. Il y a eu des étudiants qui ont créé un modèle fou, mais il a sans doute été capable de produire un modèle plus simple qui était juste suffisant.
Comment puis-je développer un modèle difficile à trouver pour lui? Je ne veux pas être super bon marché en faisant 4 termes quadratiques, 3 observations et une variance massive? Comment puis-je produire un ensemble de données apparemment inoffensif avec un petit modèle difficile en dessous?
Il a simplement 3 règles à suivre:
Votre jeu de données doit avoir une variable "Y" et 20 variables "X" étiquetées "Y", "X1", ..., "X20".
Votre variable de réponse doit provenir d'un modèle de régression linéaire qui satisfait: où et .
Toutes variables qui ont été utilisées pour créer sont contenues dans votre jeu de données.
Il convient de noter que les 20 variables X ne doivent pas toutes être dans votre modèle réel
Je pensais utiliser quelque chose comme le modèle Fama-French 3 Factor et lui demander de commencer avec les données sur les actions (SPX et AAPL) et devoir transformer ces variables en rendements continuellement composés afin de les obséder un peu plus. Mais cela me laisse avec des valeurs manquantes dans la première observation et c'est une série chronologique (dont nous n'avons pas encore discuté en classe).
Je ne sais pas si c'est le bon endroit pour publier quelque chose comme ça. J'avais l'impression que cela pourrait générer de bonnes discussions.
Edit: je ne demande pas non plus de modèles "pré-construits" en particulier. Je suis plus curieux de connaître les sujets / outils de Statistics qui permettraient à quelqu'un de s'y prendre.