Dans l'un des exercices de mon cours, nous utilisons un ensemble de données médicales Kaggle .
L'exercice dit:
nous voulons modéliser la distribution des charges individuelles et nous voulons aussi vraiment pouvoir saisir notre incertitude sur cette distribution afin de mieux saisir la plage de valeurs que nous pourrions voir. Chargement des données et exécution d'une vue initiale:
On peut soupçonner d'après ce qui précède qu'il y a une sorte de distribution de type exponentielle en jeu ici. ... Les frais de réclamation d'assurance peuvent être multimodaux. La distribution gamma peut être applicable et nous pourrions tester cela pour la distribution des frais qui n'étaient pas des réclamations d'assurance en premier.
J'ai recherché "Distribution gamma" et trouvé "une distribution unimodale continue, positive uniquement, qui code le temps requis pour que les événements" alpha "se produisent dans un processus de Poisson avec un temps d'arrivée moyen de" beta ""
Il n'y a pas de temps ici, juste des frais non liés, assurés ou non.
Pourquoi choisiraient-ils une distribution gamma?