Ne pas être critique, mais c'est une sorte d'exemple étrange. Il n'est pas clair que vous fassiez vraiment l'analyse des séries chronologiques, ni ce que le NASDAQ aurait à voir avec le nombre de matchs gagnés par une équipe. Si vous êtes intéressé à dire quelque chose sur le nombre de matchs gagnés par une équipe, je pense qu'il serait préférable d'utiliser la régression logistique binaire, étant donné que vous savez probablement combien de jeux sont joués. La régression de Poisson est la plus appropriée pour parler de dénombrements lorsque le total possible n'est pas bien contraint , ou du moins n'est pas connu.
La façon dont vous interpréteriez vos bêtas dépend, en partie, du lien utilisé - il est possible d'utiliser le lien d'identité, même si le lien du journal est plus courant (et généralement plus approprié). Si vous utilisez le lien du journal, vous ne prendriez probablement pas le journal de votre variable de réponse - le lien le fait essentiellement pour vous. Prenons un cas abstrait, vous avez un modèle de Poisson utilisant le lien de journal comme suit:
alternativement,
y^=exp(β^0)∗exp(β^1)x
y^=exp(β^0+β^1x)
(EDIT: je retire les "chapeaux" des bêtas dans ce qui suit, car ils sont moches, mais ils doivent toujours être compris.)
Avec une régression OLS normale, vous prédisez la moyenne d'une distribution gaussienne de la variable de réponse conditionnelle aux valeurs des covariables. Dans ce cas, vous prédisez la moyenne d'une distribution de Poisson de la variable de réponse conditionnelle aux valeurs des covariables. Pour OLS, si un cas donné était supérieur de 1 unité à votre covariable, vous vous attendez, toutes choses étant égales par ailleurs, la moyenne de cette distribution conditionnelle à unités plus élevée. Ici, si un cas donné était supérieur de 1 unité, ceteris paribus , vous vous attendez à ce que la moyenne conditionnelle soit fois plus élevée. Par exemple, ditesβ1eβ1 β1=2, alors dans la régression normale, il est 2 unités plus élevé (ie, +2), et ici il est 7,4 fois plus élevé (ie, x 7,4). Dans les deux cas, est votre interception ; dans notre équation ci-dessus, considérons la situation où , puis exp , et le côté droit se réduit à exp ( ), ce qui vous donne la moyenne de lorsque toutes les covariables sont égales à 0. β0x=0(β1)x=1β0y
Il y a deux ou trois choses qui peuvent prêter à confusion à ce sujet. Premièrement, prédire la moyenne d'une distribution de Poisson n'est pas la même chose que prédire la moyenne d'un gaussien. Avec une distribution normale, la moyenne est la valeur la plus probable. Mais avec le Poisson, la moyenne est souvent une valeur impossible (par exemple, si votre moyenne prédite est 2,7, ce n'est pas un compte qui pourrait exister). De plus, normalement, la moyenne n'est pas liée au niveau de dispersion (c.-à-d. L'écart-type), mais avec la distribution de Poisson, la variance est nécessairement égale à la moyenne (bien que, souvent, cela ne soit pas le cas en pratique, ce qui entraîne des complexités supplémentaires). Enfin, ces exponentiations compliquent les choses; si, au lieu d'un changement relatif, vous vouliez connaître la valeur exacte, vous devriez commencer à 0 (c.-à-d.eβ0) et multipliez votre chemin fois. Pour prédire une valeur spécifique, il est plus facile de résoudre l'expression entre parenthèses dans l'équation du bas, puis d'exponentier; cela rend le sens de la bêta moins clair, mais les calculs sont plus faciles et réduisent les risques d'erreur. x