Cela semble si élémentaire, mais je suis toujours coincé à ce stade…
La plupart des données que je traite ne sont pas normales et la plupart des analyses sont basées sur une structure GLM. Pour mon analyse actuelle, j'ai une variable de réponse qui est la "vitesse de marche" (mètres / minute). Il m'est facile d'identifier que je ne peux pas utiliser OLS, mais j'ai alors une grande incertitude quant à la décision de choisir la famille (Gamma, Weibull, etc.) appropriée!
J'utilise Stata et regarde des diagnostics comme les résidus et l'hétéroscédasticité, les résidus par rapport aux valeurs ajustées, etc.
Je suis conscient que les données de comptage peuvent prendre la forme d'un taux (par exemple les taux d'incidence) et j'ai utilisé le gamma (l'analogue des modèles binomiaux négatifs discrets surdispersés), mais je voudrais juste qu'un "pistolet fumant" dise OUI, VOUS AVEZ LE DROIT FAMILLE. La recherche des résidus standardisés par rapport aux valeurs ajustées est-elle la seule et la meilleure façon de le faire? Je voudrais également utiliser un modèle mixte pour tenir compte d'une certaine hiérarchie dans les données, mais je dois d'abord déterminer quelle famille décrit le mieux ma variable de réponse.
Toute aide appréciée. La langue Stata est particulièrement appréciée!