Des exemples de processus qui ne sont pas de Poisson?

15

Je cherche de bons exemples de situations qui ne conviennent pas au modèle avec une distribution de Poisson, pour m'aider à expliquer la distribution de Poisson aux étudiants.

On utilise couramment le nombre de clients arrivant dans un magasin dans un intervalle de temps comme exemple qui peut être modélisé par une distribution de Poisson. Je cherche un contre-exemple dans la même veine, c'est-à-dire une situation qui peut être considérée comme un processus de comptage positif en temps continu qui n'est clairement pas Poisson.

La situation devrait idéalement être aussi simple et directe que possible, afin de faciliter la compréhension et la mémorisation des élèves.

poisson-distribution teaching

— Nagel
source

5

Cette question est extraordinairement large. À moins que la portée ne soit restreinte et qu'un peu plus de contexte soit ajouté, il est très probable qu'elle finisse par être fermée. Sans vouloir sonner inutilement dur, cela revient à demander: "Quels sont quelques exemples de fleurs qui ne sont pas rouges?" (Cue Harry Chapin.)

— cardinal

1

Point pris. Mes excuses. J'aurais dû le préciser. Je l'ai édité pour essayer de le rendre plus clair.

— Nagel

1

(+1) à la question et au commentaire. La mise à jour est bien meilleure. :-)

— Cardinal

2

Je suppose que vous voulez dire "des processus donnés pour lesquels les gens pourraient au moins naïvement considérer un Poisson" (par exemple, à tout le moins, un processus de comptage). Un exemple courant se produit dans le nombre de réclamations sur les polices d'assurance générale (assurance IARD), en raison d'un certain nombre de facteurs possibles, qui se reflètent le plus évidemment dans l'hétérogénéité des taux de sinistres - il y a donc une superposition de processus de Poisson avec des intensités différentes. Dans les situations où la distribution des taux de sinistres est bien approximée par une distribution gamma, la distribution du nombre de sinistres est à son tour approximée par un binôme négatif.

— Glen_b -Reinstate Monica

5

Nombre de cigarettes fumées dans une période de temps: cela nécessite un processus de gonflage nul (par exemple Poisson gonflé zéro ou binôme négatif gonflé zéro) car tout le monde ne fume pas.

— Alexis
source

Merci! Beaucoup ici ont mentionné des processus sans gonflement, mais je pense que c'est l'exemple le plus simple et le plus illustratif qui ait été donné: le nombre de cigarettes fumées par une personne choisie au hasard dans une période de temps.

— Nagel

Il y a sans doute un accroc avec l'argument "tout le monde ne fume pas de cigarettes", cependant, dans la mesure où vous pourriez affirmer que ce processus est toujours Poisson, seulement que le paramètre d'intensité est spécifique à chaque personne et inconnu (les non-fumeurs auraient un très petit intensité) - non? Cependant, on pourrait également affirmer que cette situation viole les hypothèses de Poisson en ce que les cigarettes fumées auraient tendance à être réparties uniformément sur la journée (pour les fumeurs réguliers) ou en grappes (pour les fumeurs sociaux) de sorte que les intervalles de temps disjoints ne sont pas indépendants. C'est donc toujours un bon exemple, je pense.

— Nagel

1

Le nombre de poissons capturés dans une période de temps est, je pense, un exemple plus canonique pour ZIP et ZINB. Arguments similaires. Bien que le poisson n'ait pas le potentiel d'effets addictifs sur le taux de consommation. (Je sais, je sais, sauf pour le poisson de ta maman, car ils sont si bons :).

— Alexis

8

Voulez-vous dire des données de comptage positives? Sans bornes?

Le binôme négatif est populaire.

Un autre bon modèle est le Poisson avec 0 gonflé. Ce modèle suppose que quelque chose se passe ou non - et si c'est le cas, il suit un Poisson. J'ai vu un exemple récemment. On a demandé aux infirmières qui traitaient des patients atteints du SIDA à quelle fréquence ils avaient des comportements de stigmatisation des autres en raison de leur implication avec des patients atteints du SIDA. Un grand nombre d'entre eux n'avaient jamais vécu de telles expériences, peut-être à cause de leur lieu de travail ou de leur résidence. Parmi ceux qui l'ont fait, le nombre d'expériences stigmatisantes variait. Il y avait plus de 0 rapportés que ce à quoi vous vous attendez d'un Poisson droit, essentiellement parce qu'une certaine proportion du groupe à l'étude n'était tout simplement pas dans un environnement qui les exposait à de tels comportements.

Un mélange de Poisson vous donnerait également un processus ponctuel.

— Placidia
source

(+1) pour la distribution de Poisson gonflée à zéro. Une discussion sur ce modèle peut être trouvée ici

1

+1 à cela (et à d'autres réponses) qui fournissent des exemples réels des situations mentionnées dans la question, plutôt que de simples distributions abstraites. Cet exemple de ZIP est particulièrement clair.

— whuber

1

Au crédit de ceux qui ont répondu, je dois souligner que ma question était initialement beaucoup trop bâclée et ne faisait pas du tout référence à des situations. Je suis d'accord que le Poisson gonflé à zéro est un bon exemple. Cependant, je trouve cela un peu trop compliqué à expliquer aux étudiants de premier cycle, donc je manque encore des exemples de situations simples qui ne peuvent pas être modélisées par une distribution de Poisson.

— Nagel

4

Compter des processus qui ne sont pas des poissons? Eh bien, tout processus d'espace d'échantillon fini comme l'uniforme binomial ou discret. Vous obtenez un processus de comptage de Poisson en comptant des événements ayant des temps interarrivaux indépendants qui sont distribués de façon exponentielle, de sorte qu'une multitude de généralisations en découlent, comme avoir des temps interarrivaux distribués gamma ou lognormal ou Weibull, ou tout type de temps interarrival abstrait non paramétrique Distribution.

— AdamO
source

Merci pour votre réponse, et je suis vraiment désolé que ma question au départ était si peu claire. Je l'ai clarifié maintenant. Ce que vous dites des processus avec des temps interarrivaux non exponentiels et / ou dépendants est logique, mais avez-vous des exemples de situations qui auront ces propriétés, le plus simple sera le mieux?

— Nagel

4

Tu paries! Temps entre les épidémies de virus de l'herpès. Vous avez beaucoup plus de temps pour votre épidémie initiale, car vous devez réellement contracter le virus. Vos périodes interarrivales entre les épidémies par la suite sont indépendantes les unes des autres, mais se produisent à un rythme beaucoup plus rapide par rapport à l'épidémie d'index. Les périodes interarrivales non exponentielles sont la norme. Dans l'analyse de survie, une méthode analytique couramment utilisée est les modèles de risques proportionnels de Cox où vous supprimez toutes les hypothèses paramétriques concernant les temps interarrivaux.

— AdamO

Bon exemple! Je suppose que c'est une autre instance du Poisson gonflé à zéro mentionné par Placidia ci-dessus?

— Nagel

4

On ne sait pas si vous voulez ou non compter les processus.

Si j'interprète la balise `` enseignement '' comme signifiant que vous enseignez le processus de Poisson, alors, pour enseigner un processus en général, le processus de Bernoulli est un processus aléatoire facile à expliquer et à visualiser et est lié au processus de Poisson. Le processus de Bernoulli est l'analogue discret, il pourrait donc être un concept compagnon utile. C'est juste qu'au lieu d'un temps continu, nous avons des intervalles de temps discrets.

Un exemple pourrait être un vendeur de porte à porte où nous comptons les succès des maisons qui font un achat.

Le nombre de succès dans les n premiers essais, a une
distribution binomiale B (n, p) au lieu d'un Poisson
Le nombre d'essais nécessaires pour obtenir r succès, a une distribution binomiale négative NB (r, p) au lieu d'une distribution gamma
Le nombre d'essais nécessaires pour obtenir un succès, le temps d'attente, a une distribution géométrique NB (1, p), qui est l'analogue discret de l'exponentielle.

C'est l'approche que Bertsekas et Tsitsiklis utilisent dans Introduction To Probability , 2e éd., Introduisant le processus de Bernoulli avant le processus de Poisson. Dans leur manuel, il y a plus d'extensions au processus de Bernoulli qui sont applicables au processus de Poisson telles que les fusionner ou les partitionner, ainsi que des ensembles de problèmes avec des solutions.

Si vous cherchez des exemples de processus aléatoires et que vous voulez simplement jeter les noms, il y en a plusieurs.

Le processus gaussien est important dans les applications. Le processus de Weiner en particulier, qui est un type de processus gaussien, est également appelé mouvement brownien standard et a des applications en finance et en physique.

— Meadowlark Bradsher
source

Merci pour votre réponse, et je suis vraiment désolé que ma question au départ était si spontanée et peu claire. J'ai essayé de le clarifier maintenant. Le lien de Bernoulli à Poisson est intéressant, mais ce que je recherche, ce sont des exemples de situations en temps continu qui ne peuvent pas être modélisées par une distribution de Poisson, le plus simple sera le mieux.

— Nagel

3

En tant qu'actuaire IARD, je m'occupe d'exemples concrets de processus discrets qui ne sont pas toujours des poissons. Pour les secteurs d'activité de haute sévérité et de basse fréquence, la distribution de Poisson est mal adaptée car elle exige un rapport variance / moyenne de 1. La distribution binomiale négative, mentionnée ci-dessus, est beaucoup plus couramment utilisée, et les distributions de Delaporte est utilisé dans certains ouvrages, mais moins souvent dans la pratique actuarielle nord-américaine standard.

Pourquoi en est-il ainsi est une question plus profonde. Le binôme négatif est-il tellement meilleur car il représente un processus de Poisson dont le paramètre moyen est lui-même distribué gamma? Ou est-ce parce que les occurrences de perte manquent d'indépendance (comme le font les tremblements de terre selon la théorie actuelle, que plus on attend que la terre glisse, plus elle est due à l'augmentation de la pression), est-elle non stationnaire (les intervalles ne peut pas être subdivisé en séquences, dont chacune est stationnaire, ce qui permettrait l'utilisation d'un Poisson non homogène), et certains secteurs d'activité permettent certainement des occurrences simultanées (par exemple, faute professionnelle médicale avec plusieurs médecins couverts par la police).

— Avraham
source

2

D'autres ont mentionné plusieurs exemples de processus ponctuels qui ne sont pas de Poisson. Étant donné que le Poisson correspond aux temps interarrivaux exponentiels si vous choisissez une distribution temporelle interarrivale qui n'est pas exponentielle, le processus ponctuel résultant n'est pas Poisson. AdamO a souligné le Weibull. Vous pouvez utiliser gamma, lognormal ou beta comme choix possibles.

Le Poisson a la propriété que sa moyenne est égale à sa variance. Un processus ponctuel dont la variance est supérieure à la moyenne est parfois appelé sur-dispersé et si la moyenne est supérieure à la variance, il est sous-dispersé. Ces termes sont utilisés pour relier le processus à un Poisson. Le binôme négatif est souvent utilisé car il peut être sur-dispersé ou sous-dispersé en fonction de ses paramètres.

Le Poisson a une variance constante. Un processus ponctuel qui correspond aux conditions de Poisson, sauf qu'il n'a pas de paramètre de taux constant et par conséquent une moyenne et une variance variant dans le temps, est appelé Poisson inhomogène.

Un processus avec des temps interarrivaux exponentiels mais pouvant avoir plusieurs événements à l'heure d'arrivée est appelé Poisson composé. Bien que similaires au processus de Poisson et ayant un nom contenant le mot Poisson, les processus de Poisson inhomogènes et composés sont différents d'un processus ponctuel de Poisson.

— Michael R. Chernick
source

Merci pour votre réponse, et je suis vraiment désolé que ma question au départ était si spontanée et peu claire. J'ai essayé de le clarifier maintenant. Vous mentionnez des processus avec des temps interarrivaux non exponentiels et / ou dépendants, et ce que vous dites des distributions sur et sous-dispersées est très intéressant, mais avez-vous des exemples de situations concrètes qui auront ces propriétés? Le plus simple sera le mieux :)

— Nagel

1

Plutôt que d'essayer de donner ma propre réponse, je pense qu'il y a vraiment beaucoup, beaucoup d'exemples que vous pouvez trouver dans les livres qui traitent des processus de comptage. Permettez-moi de vous recommander de lire le livre de Joe Hilbe sur la régression binomiale négative .

— Michael R. Chernick

2

Un autre exemple intéressant de processus de comptage sans Poisson est représenté par la distribution de Poisson tronquée à zéro (ZTPD). Le ZTPD peut ajuster des données concernant le nombre de langues que les sujets peuvent parler dans des conditions physiologiques. Dans ce cas, la distribution de Poisson se comporte mal, car le nombre de langues parlées est par définition> = 1: donc 0 est exclu a priori.

— Carlo Lazzaro
source

2

Je pense que vous pouvez prendre votre processus de Poisson d'arrivée des clients et le modifier de deux manières différentes: 1) les arrivées de clients sont mesurées 24 heures par jour, mais le magasin n'est pas réellement ouvert toute la journée, et 2) imaginez deux magasins concurrents avec Poisson traite les heures d'arrivée des clients et examine la différence entre les arrivées dans les deux magasins. (L'exemple n ° 2 provient de ma compréhension du Springer Handbook of Engineering Statistics, partie A, propriété 1.4.)

— Wayne
source

1

Vous voudrez peut-être reconsidérer l'exemple du football. Il semble que les taux de score des deux équipes augmentent au fur et à mesure du match, et qu'ils changent lorsque les équipes modifient leurs priorités d'attaque / défense en fonction du score actuel.

Ou plutôt, utilisez-le comme un exemple de la façon dont les modèles simples peuvent fonctionner étonnamment bien, stimulant l'intérêt pour l'investigation statistique de certains phénomènes, et fournissant une référence pour de futures études qui collectent plus de données pour enquêter sur les écarts et proposer des élaborations.

Dixon & Robinson (1998), "Un modèle de processus de naissance pour les matchs de football d'association", The Statistician , 47 , 3.

— Scortchi - Réintégrer Monica
source

J'avais le pressentiment que les matchs de football n'étaient pas tout à fait Poisson, mais merci pour la référence :)

— Nagel

1

Étant donné que la question est liée à la compréhension de la distribution de Poisson, je vais essayer, car j'ai récemment examiné cela quelque peu pour les modèles d'appels entrants du centre d'appels (qui suivent une distribution exponentielle sans mémoire au fil du temps).

Je pense que plonger dans un autre modèle tangentiel qui nécessite essentiellement la connaissance de Poisson pour comprendre comment ce n'est pas le cas peut être quelque peu déroutant, mais c'est juste moi.

Je pense que le problème avec la compréhension de Poisson est l'axe temporel continu sur lequel il se trouve --- à chaque seconde, l'événement ne risque plus de se produire --- mais plus vous allez loin dans le futur, plus il est certain événement.

Vraiment, je pense que cela simplifie la compréhension si vous échangez simplement l'axe «temps» contre des «essais» ou des «événements».

Quelqu'un peut me corriger si c'est loin de la base, car je pense que c'est une explication facile, mais je pense que vous pouvez remplacer le lancer d'une pièce, ou le lancer d'un dé, par `` le temps jusqu'à ce qu'un appel téléphonique arrive '' (ce que je généralement utilisé pour Erlang C / personnel du centre d'appels).

Au lieu de "temps jusqu'à ce qu'un appel téléphonique arrive" ---- vous pouvez le remplacer par ... "lance jusqu'à ce qu'un dé atteigne six".

Cela suit la même logique générale. La probabilité (comme tout jeu) est complètement indépendante à chaque lancer (ou minute) et est sans mémoire. Cependant, la probabilité de «non 6» diminue toujours plus lentement mais sûrement vers 0 à mesure que vous augmentez le nombre d'essais. C'est plus facile si vous voyez les deux graphiques (probabilité d'appel avec le temps, vs probabilité de six avec des rouleaux).

Je ne sais pas si cela a du sens - c'est ce qui m'a aidé à le mettre en termes concrets. Maintenant, la distribution de poisson est un décompte plutôt qu'un «temps entre les appels» ou des «essais jusqu'à ce que le résultat soit six» - mais elle repose sur cette probabilité.

— John Babson
source

Je peux voir comment vous pensez que cela pourrait être source de confusion pour les étudiants, mais mon idée était simplement que cela me permettrait d'expliquer plus facilement pourquoi le nombre de clients arrivant dans un restaurant dans un intervalle de temps est Poisson, si j'avais un compteur -exemple d'un processus simple avec des événements discrets en temps continu qui n'était pas Poisson.

— Nagel

1

Il y a de nombreuses options, je pense. Un schéma évident serait les événements dont la probabilité augmente ou diminue avec leur propre occurrence. Difficile de penser à quelques exemples. Peut-être que les fourmis arrivent dans votre cuisine / pique-nique. Le temps qu'il faut pour que la première fourmi arrive est probablement beaucoup plus long que le deuxième ou le troisième, et bien sûr, plus d'arrivées de fourmis signifient des arrivées futures de fourmis plus probables (étant donné leurs sentiers / communication les uns avec les autres). Je ne sais pas si cela compterait.

— John Babson

1

Nombre de visites d'un client individuel à l'épicerie dans un intervalle de temps donné.

Après avoir été à l'épicerie, il est peu probable que vous reveniez pendant un certain temps, sauf si vous avez fait une erreur de planification.

Je pense que la distribution binomiale négative pourrait être utilisée ici, mais elle est discrète, alors que les visites se font en temps continu.

— JosiahYoder-désactivé sauf ..
source