J'ai un ensemble de données, et x . Je voudrais tester l'hypothèse suivante: il y a un pic en y ; c'est-à-dire que x augmente, y augmente d'abord puis diminue.
Ma première idée était d'installer et x 2 dans un reflex. C'est-à-dire que si je trouve que le coefficient avant x est significativement positif et que le coefficient avant x 2 est significativement négatif, alors j'ai le soutien de l'hypothèse. Cependant, cela ne vérifie qu'un seul type de relation (quadratique) et peut ne pas nécessairement saisir l'existence du pic.
J'ai alors pensé à trouver , une telle région de (valeurs triées de) x , que b soit entre a et c , deux autres régions de x qui contiennent au moins autant de points que b , et que ¯ y b > ¯ y a et ¯ y b > ¯ y c de manière significative. Si l'hypothèse est vraie, nous devrions nous attendre à beaucoup de ces régions b . Ainsi, si le nombre de b est suffisamment grand, l'hypothèse devrait être appuyée.
Pensez-vous que je suis sur la bonne voie pour trouver un test adapté à mon hypothèse? Ou suis-je en train d'inventer la roue et il existe une méthode établie pour ce problème? J'apprécierai grandement votre contribution.
MISE À JOUR. Ma variable dépendante est count (entier non négatif).