J'ai posté ceci sur mathoverflow et personne ne répond:
La méthode de Scheffé pour identifier les contrastes statistiquement significatifs est largement connue. Un contraste entre les moyennes , de populations est une combinaison linéaire dans laquelle , et un multiple scalaire d'un contraste est essentiellement le même contraste, donc on pourrait dire que l'ensemble des contrastes est un espace projectif. La méthode de Scheffé teste une hypothèse nulle qui dit que tous les contrastes parmi ces populations sont , et étant donné un niveau de signification , rejette l'hypothèse nulle avec probabilité i = 1 , … , r r ∑ r i = 1 c i μ i ∑ r i = 1 c i = 00 α α 0étant donné que l'hypothèse nulle est vraie. Et si l'hypothèse nulle est rejetée, Scheffé souligne que son test nous indique quels contrastes diffèrent significativement de (je ne suis pas sûr que l'article Wikipedia que j'ai lié aux points le souligne).
Je voudrais savoir si l'on peut faire quelque chose de similaire dans une situation différente. Considérons un modèle de régression linéaire simple , où , .ε i ∼ i . i . d . N ( 0 , σ 2 ) i = 1 , … , n
L'hypothèse nulle que je veux considérer concerne un autre type de contraste. Il dit qu'il n'y a pas de sous-ensemble tel que pour i ∈ A et E ( Y i ) = α 2 + β x i pour i ∉ A , où α 1 ≠ α 2 . Si le sous-ensemble A est spécifié à l'avance, un t à deux échantillons ordinaireE ( Y i ) = α 1 + β x i-test le fait, mais nous voulons quelque chose qui considère tous les sous-ensembles et maintient la probabilité de rejeter une vraie hypothèse nulle.
On pourrait comprendre cela si l'efficacité n'était pas un problème: trouver un test qui passe par toutes les possibilités. Même alors, c'est problématique; deux contrastes ne seraient pas indépendants. J'ai demandé à un expert sur la détection des valeurs aberrantes à ce sujet et il vient de dire que c'est un cauchemar combinatoire. Ensuite, j'ai demandé si l'on pouvait prouver qu'il n'y avait pas de moyen efficace de le faire, peut-être en y réduisant un problème NP-difficile. Il vient de dire qu'il reste à l'écart des problèmes NP-difficiles.
Donc: peut-on prouver que ce problème est "difficile" ou qu'il ne l'est pas?