Ce que vous décrivez nécessite un traitement spécial, ce n'est pas ce que nous entendons habituellement par "variables aléatoires tronquées" - et ce que nous entendons généralement est que la variable aléatoire ne se situe pas en dehors du support tronqué, ce qui signifie qu'il n'y a pas de concentration de masse de probabilité à le point de troncature. Pour contraster les cas:
A) Signification "habituelle" d'un rv tronqué
Pour toute distribution que nous tronquons son support, nous devons "corriger" sa densité afin qu'elle s'intègre à l'unité lorsqu'elle est intégrée sur le support tronqué. Si la variable est prise en charge dans , , alors (pdf , cdf )[a,b]−∞<a<b<∞fF
∫bafX(x)dx=∫MafX(x)dx+∫bMfX(x)dx=∫MafX(x)dx+[1−FX(M)]=1
⇒∫MafX(x)dx=FX(M)
Puisque le LHS est l'intégrale sur le support tronqué, nous voyons que la densité du rv tronqué, appelons-le , doit êtreX~
fX~(x~)=fX(x∣X≤M)=fX(x)dx⋅[FX(M)]−1
afin que il s'intègre à l'unité sur . Le terme moyen dans l'expression ci-dessus nous fait penser (à juste titre) à cette situation comme une forme de
conditionnement - mais pas sur une autre variable aléatoire, mais sur les valeurs possibles que le RV lui-même peut prendre. Ici, une fonction conjointe densité / vraisemblance d'une collection de iid rv tronqués serait fois la densité ci-dessus, comme d'habitude.
[a,M]nn
B) Probabilité de concentration massique
Ici, c'est ce que vous décrivez dans la question, les choses sont différentes. Le point concentre toute la masse de probabilité qui correspond à l'appui de la variable supérieure à . Cela crée un point de discontinuité dans la densité et lui donne deux branchesM M
fX∗(x∗)fX∗(x∗)=fX(x∗)x∗<M=P(X∗≥M)x∗≥M
Informellement, le second est "comme un RV discret" où chaque point de la fonction de masse de probabilité représente les probabilités réelles. Supposons maintenant que nous ayons telles variables aléatoires iid, et nous voulons former leur fonction conjointe densité / vraisemblance. Avant de regarder l'échantillon réel, quelle branche choisir? Nous ne pouvons pas prendre cette décision, nous devons donc en quelque sorte inclure les deux. Pour ce faire, nous devons utiliser des fonctions d'indicateur: notons la fonction d'indicateur qui prend la valeur lorsque et sinon. La densité d'un tel VR peut s'écrirenI{x∗≥M}≡I≥M(x∗)1x∗≥M0
fX∗(x∗)=fX(x∗)⋅[1−I≥M(x∗)]+P(X∗≥M)⋅I≥M(x∗)
et donc la fonction de densité conjointe de telles variables iid est
n
fX∗(X∗∣θ)=∏i=1n[fX(x∗i)⋅[1−I≥M(x∗i)]+P(X∗i≥M)⋅I≥M(x∗i)]
Maintenant, ce qui précède vu comme une fonction de vraisemblance, l'échantillon réel constitué de réalisations de ces variables aléatoires entre en jeu. Et dans cet échantillon, certaines réalisations observées seront inférieures au seuil , certaines égales. Notons le nombre de réalisations dans l'échantillon égal à , et tout le reste, . Il est immédiat que pour les réalisations, la partie correspondante de la densité qui restera vraisemblablement sera la partie , tandis que pour les réalisations, l'autre partie. alorsnMmMvm+v=nmP(X∗i≥M)v
L(θ∣{x∗i;i=1,...n})=∏i=1v[fX(x∗i)]⋅∏j=1m[P(X∗j≥M)]=∏i=1v[fX(x∗i)]⋅[P(X∗≥M)]m