Voici un peu de contexte. Je souhaite déterminer comment deux variables environnementales (température, niveaux de nutriments) affectent la valeur moyenne d'une variable de réponse sur une période de 11 ans. Chaque année, des données proviennent de plus de 100 000 emplacements.
Le but est de déterminer si, au cours de la période de 11 ans, la valeur moyenne des variables de réponse a répondu aux changements des variables environnementales (par exemple, une température plus chaude + plus de nutriments = une plus grande réponse).
Malheureusement, comme la réponse est la valeur moyenne (sans regarder la moyenne, seule une variation interannuelle régulière submergera le signal), la régression sera de 11 points de données (1 valeur moyenne par an), avec 2 variables explicatives. Pour moi, même une régression positive linéaire sera difficile à considérer comme significative étant donné que l'ensemble de données est si petit (ne répond même pas aux 40 points / variables nominaux, sauf si la relation est super forte).
Ai-je raison de faire cette supposition? Quelqu'un peut-il offrir d'autres pensées / perspectives qui pourraient me manquer?
PS: quelques mises en garde: il n'y a aucun moyen d'obtenir plus de données sans attendre des années supplémentaires. Les données disponibles sont donc celles avec lesquelles nous devons vraiment travailler.