J'ai une question sur la distribution correcte à utiliser pour créer un modèle avec mes données. J'ai effectué un inventaire forestier avec 50 parcelles, chaque parcelle mesure 20m × 50m. Pour chaque parcelle, j'ai estimé le pourcentage de couvert arboré qui ombrage le sol. Chaque parcelle a une valeur, en pourcentage, pour la couverture de la canopée. Les pourcentages vont de 0 à 0,95. Je fais un modèle de pourcentage de couvert arboré ( variable Y ), avec une matrice de variables X indépendantes basées sur l'imagerie satellite et les données environnementales.
Je ne sais pas si je devrais utiliser une distribution binomiale, car une variable aléatoire binomiale est la somme de n essais indépendants (c.-à-d. Les variables aléatoires de Bernoulli). Les valeurs en pourcentage ne sont pas la somme des essais; ce sont les pourcentages réels. Dois-je utiliser le gamma, même s'il n'a pas de limite supérieure? Dois-je convertir des pourcentages en nombres entiers et utiliser Poisson comme nombre? Dois-je rester avec Gaussian? Je n'ai pas trouvé beaucoup d'exemples dans la littérature ou dans les manuels qui tentent de modéliser des pourcentages de cette manière. Tous les conseils ou idées sont appréciés.
Merci pour vos réponses. En fait, la distribution bêta est exactement ce dont j'ai besoin et est discutée en détail dans cet article:
Eskelson, BN, Madsen, L., Hagar, JC et Temesgen, H. (2011). Estimation de la couverture végétale du sous-étage riverain avec des modèles de régression bêta et de copules. Forest Science, 57 (3), 212-221.
Ces auteurs utilisent le package betareg en R de Cribari-Neto et Zeileis.
L'article suivant décrit un bon moyen de transformer une variable de réponse bêta distribuée lorsqu'elle inclut de vrais 0 et / ou 1 dans la plage de pourcentages:
- Smithson, M. et J. Verkuilen, 2006. Un meilleur presse- citron? Régression de vraisemblance maximale avec des variables dépendantes distribuées bêta , Méthodes psychologiques, 11 (1): 54–71.