En économétrie, nous dirions que la non-normalité viole les conditions du modèle de régression linéaire classique classique, tandis que l'hétéroscédasticité viole à la fois les hypothèses du CNLR et du modèle de régression linéaire classique.
Mais ceux qui disent "... violent l'OLS" sont également justifiés: le nom des moindres carrés ordinaires vient directement de Gauss et fait essentiellement référence à des erreurs normales . En d'autres termes, "MCO" n'est pas un acronyme pour une estimation par les moindres carrés (qui est un principe et une approche beaucoup plus généraux), mais du CNLR.
Ok, c’était l’histoire, la terminologie et la sémantique. Je comprends l'essentiel de la question du PO comme suit: "Pourquoi devrions-nous souligner l'idéal si nous avons trouvé des solutions au cas où il n'est pas présent?" (Parce que les hypothèses de CNLR sont idéales, en ce sens qu'elles fournissent d'excellentes propriétés d' estimation de moindres carrés "disponibles dans le commerce", et sans la nécessité de recourir à des résultats asymptotiques. N'oubliez pas également que la méthode MLS est la plus grande probabilité lorsque les erreurs sont normales. ).
En tant qu’idéal, c’est un bon endroit pour commencer à enseigner . C’est ce que nous faisons toujours dans l’enseignement de tout type de sujet: les situations "simples" sont des situations "idéales", sans les complexités que l’on rencontrera réellement dans la vie réelle et dans la recherche réelle, et pour lesquelles il n’existe pas de solutions définitives .
Et c’est ce que je trouve problématique dans le message du PO: il parle d’erreurs standard robustes et de bootstrap comme s’il s’agissait «d’alternatives supérieures» ou de solutions irréprochables à l’absence desdites hypothèses en discussion pour lesquelles le PO écrit en outre
"..assomptions que les gens ne doivent pas se rencontrer"
Pourquoi? Parce qu'il existe des méthodes pour gérer la situation, des méthodes qui ont certes une validité, mais qui sont loin d'être idéales? Le bootstrap et l'hétéroscédasticité - les erreurs types robustes ne sont pas les solutions - si c'était effectivement le cas, ils seraient devenus le paradigme dominant, renvoyant le CLR et le CNLR aux livres d'histoire. Mais ils ne sont pas.
Nous partons donc de l’ensemble des hypothèses qui garantissent les propriétés de l’estimateur que nous avons jugées importantes (il convient de se demander si les propriétés désignées comme souhaitables sont bien celles qui devraient l'être), afin de garder à l'esprit que toute violation de celles-ci a conséquences qui ne peuvent être entièrement compensées par les méthodes que nous avons trouvées afin de remédier à l'absence de ces hypothèses. Scientifiquement parlant, il serait très dangereux de donner le sentiment que "nous pouvons nous frayer un chemin vers la vérité", car, tout simplement, nous ne le pouvons pas.
Elles restent donc des solutions imparfaites à un problème , et non une alternative et / ou une manière définitivement supérieure de faire les choses. Par conséquent, nous devons d’abord enseigner la situation sans problème, puis indiquer les problèmes possibles, puis discuter des solutions possibles. Sinon, nous élèverions ces solutions à un statut qu’ils n’ont pas vraiment.