Wolfram Mathworld fait-il une erreur en décrivant une distribution de probabilité discrète avec une fonction de densité de probabilité?

Habituellement, une distribution de probabilité sur des variables discrètes est décrite à l'aide d'une fonction de masse de probabilité (PMF):

Lorsque nous travaillons avec des variables aléatoires continues, nous décrivons les distributions de probabilité en utilisant une fonction de densité de probabilité (PDF) plutôt qu'une fonction de masse de probabilité.

- Deep Learning par Goodfellow, Bengio et Courville

Cependant, Wolfram Mathworld utilise PDF pour décrire la distribution de probabilité sur des variables discrètes:

Est-ce une erreur? ou ça n'a pas beaucoup d'importance?

— czlsws
source

C'est bâclé, à mon avis, mais pas très important. C'est même défendable s'ils abordent la probabilité du point de vue de la théorie de la mesure, bien que cela semble un peu beaucoup pour une introduction au retournement d'une pièce. (Assez bizarre, ils ne semblent pas avoir d'article sur les PMF.)

— Dave

un pmf est une densité par rapport à la mesure de comptage

— Xi'an

Lorsque vous discutez de la théorie des probabilités au niveau de l'espace de mesure spécifié par 3 éléments, pdf et pmf n'ont pas de différence, donc le pmf est supprimé. Toutes les distributions peuvent être spécifiées par pdf. wolfram est un site Web de mathématiques, il n'est donc pas surprenant qu'ils utilisent des mathématiques de haut niveau pour parler de probabilité. Voici une bonne lecture gratuite. stat.washington.edu/~pdhoff/courses/581/LectureNotes/…

— user158565

Réponses:

Ce n'est pas une erreur: dans le traitement formel des probabilités, via la théorie des mesures, une fonction de densité de probabilité est une dérivée de la mesure de probabilité d'intérêt, prise par rapport à une "mesure dominante" (également appelée "mesure de référence"). Pour les distributions discrètes sur les entiers, la fonction de masse de probabilité est une fonction de densité par rapport à la mesure de comptage . Puisqu'une fonction de masse de probabilité est un type particulier de fonction de densité de probabilité, vous trouverez parfois des références comme celle-ci qui s'y réfèrent comme une fonction de densité, et ils n'ont pas tort de s'y référer de cette façon.

Dans le discours ordinaire sur les probabilités et les statistiques, on évite souvent cette terminologie et fait une distinction entre les "fonctions de masse" (pour les variables aléatoires discrètes) et les "fonctions de densité" (pour les variables aléatoires continues), afin de distinguer les distributions discrètes et continues. Dans d'autres contextes, où l'on énonce des aspects holistiques de la probabilité, il est souvent préférable d'ignorer la distinction et de se référer aux deux comme «fonctions de densité».

— Réintégrer Monica
source

Merci pour votre réponse. Est-ce que treatment«dans le traitement formel des probabilités» signifie notation, perspective, convention ou autre chose?

— czlsws

Lorsque je parle ici du "traitement formel", je fais référence à la base moderne de la théorie des probabilités, qui est un sous-ensemble de la théorie de la mesure. Telle est la théorie mathématique qui est acceptée comme fondement formel de la probabilité.

— Rétablir Monica le

"une fonction de densité de probabilité est une dérivée de la mesure de probabilité d'intérêt". Il me semble que dans un certain sens, il s'agit plus d'une "anti-intégrale" que d'une dérivée. Il existe des PDF discontinus, comme la distribution uniforme, et les distributions discrètes peuvent être traitées comme des sommes de fonctions delta de Dirac. Dans ces cas, il faudrait avoir à généraliser le concept d'un dérivé bien au-delà de la compréhension ordinaire pour qu'il s'applique.

— Accumulation

@Acccumulation - comment la distribution uniforme est-elle discontinue? ... et la théorie de la mesure est un traitement beaucoup plus général de l'intégration et de la différenciation que ne le permet la compréhension ordinaire de Calc I et II.

— jbowman

@Accumulation: Oui, c'est une caractérisation juste, et en effet, c'est ce qui est fait. Techniquement, la densité est un dérivé de Radon-Nikodym , qui est en effet un type "d'anti-intégrale" du type que vous décrivez.

— Rétablir Monica le

En plus de la réponse plus théorique en termes de théorie de la mesure, il est également pratique de ne pas distinguer entre pmfs et pdfs dans la programmation statistique. Par exemple, R a une multitude de distributions intégrées. Pour chaque distribution, il a 4 fonctions. Par exemple, pour la distribution normale (à partir du fichier d'aide):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

Les utilisateurs R deviennent rapidement habitués aux d,p,q,rpréfixes. Ce serait ennuyeux si vous deviez faire quelque chose comme drop det use mpour par exemple la distribution binomiale. Au lieu de cela, tout est comme un utilisateur R devrait s'y attendre:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.

— John Coleman
source

scipy.statsdistingue, certains objets ont une pdfméthode et d'autres ont une pmfméthode. Ça m'énerve vraiment!

— Matthew Drury