À un niveau purement formel, on pourrait appeler la théorie des probabilités l'étude des espaces de mesure avec la mesure totale un, mais ce serait comme appeler la théorie des nombres l'étude des chaînes de chiffres qui se terminent
- des sujets de Terry Tao en théorie des matrices aléatoires .
Je pense que c'est la chose vraiment fondamentale. Si nous avons un espace de probabilité et une variable aléatoire X : Ω → R avec une mesure directe P X : = P ∘ X - 1 , alors la raison pour laquelle une densité f = d P X(Ω,F,P)X:Ω→RPX:=P∘X−1 s'intègre à un parce queP(Ω)=1f=dPXdμP(Ω)=1 . Et c'est plus fondamental que pdfs vs pmfs.
Voici la preuve:
∫Rfdμ=∫RdPX=PX(R)=P({ω∈Ω:X(ω)∈R})=P(Ω)=1.
Il s'agit presque d'une reformulation de la réponse d'AdamO (+1) car tous les CDF sont càdlàg, et il existe une relation biunivoque entre l'ensemble des CDF sur et l'ensemble de toutes les mesures de probabilité sur ( R , B ) , mais puisque le CDF d'un RV est défini en fonction de sa distribution, je considère les espaces de probabilité comme le point de départ de ce type d'effort.R(R,B)
Je mets à jour pour développer la correspondance entre les CDF et les mesures de probabilité et comment les deux sont des réponses raisonnables à cette question.
Nous commençons par commencer par deux mesures de probabilité et analyser les CDF correspondants. Nous concluons en commençant par un CDF et en regardant la mesure induite par celui-ci.
Soit et R des mesures de probabilité sur ( R , B ) et soit F Q et F R leurs CDF respectifs (c'est-à-dire F Q ( a ) = Q ( ( - ∞ , a ] ) et de même pour R ). Q et R les deux représenteraient des mesures directes de variables aléatoires (c'est-à-dire des distributions), mais peu importe d'où elles viennent pour cela.QR(R,B)FQFRFQ(a)=Q((−∞,a])RQR
L'idée clé est la suivante: si et R s'accordent sur une collection d'ensembles suffisamment riche, alors ils s'accordent sur l' algèbre σ générée par ces ensembles. Intuitivement, si nous avons une collection bien tenue d'événements qui, à travers un nombre dénombrable de compléments, d'intersections et d'unions, forment tous BQRσB , alors s'entendre sur tous ces ensembles ne laisse aucune marge de manœuvre pour être en désaccord sur un ensemble Borel.
Formalisons cela. Soit et soit L = { A ⊆ R : Q ( A ) = R ( A ) } , c'est-à-dire L est le sous-ensemble de P ( R ) sur lequel Q et R d'accord (et sont définis) .Notez que nous leur permettons de se mettre d'accord sur des ensembles non-Borel puisque L tel que défini n'est pas nécessairement un sous-ensemble deS={(−∞,a]:a∈R}L={A⊆R:Q(A)=R(A)}LP(R)QRL . Notre objectif est de montrer que B ⊆ LBB⊆L .
Il s'avère que (l' algèbre σ générée par S ) est en fait B , donc nous espérons que S est une collection d'événements suffisamment grande pour que si Q = R partout sur S alors ils sont forcés d'être égaux sur tout Bσ(S)σSBSQ=RSB .
Notez que est fermé sous des intersections finies, et que L est fermé sous des compléments et des intersections disjointes dénombrables (cela découle de l' additivité σ ). Cela signifie que S est un π -système et L est un λ -système . Soit dit en π - λ théorème que nous avons donc σ ( S ) = B de la L . Les éléments de SSLσSπLλπλσ(S)=B⊆LSsont loin d'être aussi complexes qu'un ensemble borel arbitraire, mais parce que tout ensemble borel peut être formé à partir d'un nombre dénombrable de compléments, d'unions et d'intersections d'éléments de , s'il n'y a pas un seul désaccord entre Q et R sur des éléments de S alors cela sera suivi jusqu'à ce qu'il n'y ait pas de désaccord sur tout B ∈ BSQRSB∈B .
Nous venons de montrer que si alors Q = R (sur B ), ce qui signifie que la carte Q ↦ F Q de P : = { P : P est une mesure de probabilité sur ( R , B ) } à F : = { F : R → R : F est un CDF } est une injection.FQ=FRQ=RBQ↦FQP:={P:P is a probability measure on (R,B)}F:={F:R→R:F is a CDF}
Maintenant, si nous voulons penser à aller dans l'autre sens, nous voulons commencer par un CDF et montrer qu'il existe une mesure de probabilité unique Q telle que F ( a ) = Q ( ( - ∞ , a ] ) . Cela établira que notre cartographie Q ↦ F Q est en fait une bijection. Pour cette direction, nous définissons F sans aucune référence à une probabilité ou à des mesures.FQF(a)=Q((−∞,a])Q↦FQF
On définit d'abord une fonction de mesure de Stieltjes comme une fonction telle queG:R→R
- est non décroissantG
- est continu à droiteG
(et notez comment être càdlàg découle de cette définition, mais en raison de la contrainte supplémentaire non décroissante "la plupart" des fonctions càdlàg ne sont pas des fonctions de mesure de Stieltjes).
On peut montrer que chaque fonction de Stieltjes induit une mesure unique μ sur ( R , B ) définie par
μ ( ( a , b ] ) = G ( b ) - G ( a )
(voir par exemple la probabilité de Durrett et les processus aléatoires pour plus de détails Par exemple, la mesure de Lebesgue est induite par G ( x ) = xGμ(R,B)
μ((a,b])=G(b)−G(a)
G(x)=x .
Notant maintenant qu'un CDF est une fonction de Stieltjes avec les propriétés supplémentaires que lim x → - ∞ F ( x ) : = F ( - ∞ ) = 0 et lim x → ∞ F ( x ) : = F ( ∞ ) = 1 , nous pouvons appliquer ce résultat pour montrer que pour chaque CDF F, nous obtenons une mesure unique Q sur ( R , B )Flimx→−∞F(x):=F(−∞)=0limx→∞F(x):=F(∞)=1FQ(R,B)défini par
Q((a,b])=F(b)−F(a).
Notez comment et Q ( ( - ∞ , - ∞ ] ) = F ( ∞ ) - F ( - ∞ ) = 1 donc Q est une mesure de probabilité et est exactement celle que nous aurions utilisée pour définir FQ((−∞,a])=F(a)−F(−∞)=F(a)Q((−∞,−∞])=F(∞)−F(−∞)=1QF si nous allions dans l'autre sens.
All together we have now seen that the mapping Q↦FQ is 1-1 and onto so we really do have a bijection between P and F. Bringing this back to the actual question, this shows that we could equivalently hold up either CDFs or probability measures as our object which we declare probability to be the study of (while also recognizing that this is a somewhat facetious endeavor). I personally still prefer probability spaces because I feel like the theory more naturally flows in that direction but CDFs are not "wrong".