J'ai une question méthodologique générale. Il a peut-être été répondu auparavant, mais je ne parviens pas à localiser le fil correspondant. J'apprécierai les indications de doublons possibles.
( Voici une excellente, mais sans réponse. C'est également similaire dans l'esprit, même avec une réponse, mais cette dernière est trop spécifique de mon point de vue. Elle est également proche, découverte après avoir posté la question.)
Le thème est de savoir comment faire une inférence statistique valide lorsque le modèle formulé avant de voir les données ne décrit pas correctement le processus de génération des données . La question est très générale, mais je vais donner un exemple particulier pour illustrer ce point. Cependant, je m'attends à ce que les réponses se concentrent sur la question méthodologique générale plutôt que de tergiverser sur les détails de l'exemple particulier.
Prenons un exemple concret: dans un paramètre de série chronologique, je suppose que le processus de génération de données est avec . Je vise à tester l'hypothèse du sujet selon laquelle . J'ai jeté ceci en termes de modèle pour obtenir une contrepartie statistique réalisable de mon hypothèse de sujet, et ceci est Jusqu'ici tout va bien. Mais lorsque j'observe les données, je découvre que le modèle ne décrit pas correctement les données. Disons qu'il existe une tendance linéaire, de sorte que le véritable processus de génération de données est avec
Comment puis-je faire une inférence statistique valide sur mon hypothèse de sujet ?
Si j'utilise le modèle d'origine, ses hypothèses sont violées et l'estimateur de n'a pas la bonne distribution qu'il aurait autrement. Par conséquent, je ne peux pas tester l'hypothèse en utilisant le test .
Si, après avoir vu les données, je passe du modèle à et change mon hypothèse statistique de à , les hypothèses du modèle sont satisfaites et je obtenir un estimateur bien comporté de et peut tester sans difficulté en utilisant le test . Cependant, le passage de à
est informé par l'ensemble de données sur lequel je souhaite tester l'hypothèse. Cela rend la distribution de l'estimateur (et donc aussi l'inférence) conditionnelle au changement du modèle sous-jacent, qui est dû aux données observées. Il est clair que l'introduction d'un tel conditionnement n'est pas satisfaisante.
Y a-t-il une bonne sortie? (Si ce n'est pas fréquentiste, alors peut-être une alternative bayésienne?)