Le gamma a une propriété partagée par le lognormal; à savoir que lorsque le paramètre de forme est maintenu constant pendant que le paramètre d'échelle est modifié (comme c'est habituellement le cas lorsque vous utilisez l'un des modèles), la variance est proportionnelle à la moyenne quadratique (coefficient de variation constant).
Quelque chose d'approximatif à cela se produit assez souvent avec les données financières, voire avec beaucoup d'autres types de données.
En conséquence, il convient souvent aux données continues, positives, asymétriques à droite et où la variance est presque constante à l’échelle logarithmique, bien qu’il existe un certain nombre d’autres choix bien connus (et souvent assez facilement disponibles). Propriétés.
En outre, il est courant d’adapter un lien de journal au GLM gamma (il est relativement plus rare d’utiliser le lien naturel). Ce qui le rend légèrement différent de l'ajustement d'un modèle linéaire normal aux journaux des données, c'est qu'à l'échelle du journal, le gamma est laissé incliné à des degrés divers, tandis que la normale (le journal d'un log-normal) est symétrique. Cela le rend (le gamma) utile dans diverses situations.
J'ai vu des utilisations pratiques des GLM gamma discutées (avec des exemples de données réelles) dans (de mémoire) de Jong & Heller et Frees ainsi que dans de nombreux articles; J'ai également vu des applications dans d'autres domaines. Oh, et si je me souviens bien, Venables et Ripley's MASS l’ utilisent pour lutter contre l’absentéisme à l’école (les données quine; Edit: en fait, c’est effectivement dans Statistics Complements to MASS , voir p11, 14e page du pdf, il contient un lien il y a un petit décalage de la DV). Euh, et McCullagh et Nelder ont donné un exemple de coagulation du sang, bien que ce soit peut-être un lien naturel.
Il y a ensuite le livre de Faraway dans lequel il a donné un exemple d'assurance de voiture et un exemple de données de fabrication de semi-conducteurs.
Il y a des avantages et des inconvénients à choisir l'une ou l'autre des deux options. Depuis ces jours, les deux sont faciles à adapter; c'est généralement une question de choix de ce qui convient le mieux.
C'est loin d'être la seule option; Par exemple, il y a aussi les GLMs à gaussie inverse, qui ont une queue plus lourde (et même plus hétéroskédastique) que gamma ou lognormale.
En ce qui concerne les inconvénients, il est plus difficile de faire des intervalles de prédiction. Certains écrans de diagnostic sont plus difficiles à interpréter. Le calcul des attentes à l’échelle du prédicteur linéaire (généralement l’échelle logarithmique) est plus difficile que pour le modèle lognormal équivalent. Les tests d'hypothèses et les intervalles sont généralement asymptotiques. Ce sont souvent des problèmes relativement mineurs.
Elle présente certains avantages par rapport à la régression log-normale log-link (prendre des journaux et adapter un modèle de régression linéaire ordinaire); on est que la prédiction moyenne est facile.