Trouver un moyen de simuler des nombres aléatoires pour cette distribution

20

J'essaie d'écrire un programme en R qui simule des nombres pseudo aléatoires à partir d'une distribution avec la fonction de distribution cumulative:

F (x) = 1 - \exp (- a x - \frac{b}{p + 1} x^{p + 1}), x \geq 0

$F(x)= 1-\exp \left(-ax-\frac{b}{p+1}x^{p+1}\right), \quad x \geq 0$

où $a,b>0, p \in (0,1)$

J'ai essayé l'échantillonnage par transformée inverse mais l'inverse ne semble pas résoluble analytiquement. Je serais heureux si vous pouviez suggérer une solution à ce problème

r random-generation

— Sébastien
source

1

Pas assez de temps pour une réponse complète, mais vous pouvez vérifier les algorithmes d'échantillonnage d'importance, comme alternative.

— chuse

1

ce n'est pas un exercice de manuel, j'ai seulement stipulé la contrainte car c'est une hypothèse raisonnable pour mes données

— Sebastian

6

Je suis alors surpris de la normalisation "miraculeuse" de

(p + 1)^{- 1}

$(p+1)^{-1}$ qui transforme la distribution en une puissance parfaite d'exponentielle, mais des miracles se produisent (avec une faible probabilité).

— Xi'an

49

Il existe une solution simple (et si je peux ajouter, élégante) à cet exercice: puisque apparaît comme le produit de deux distributions de survie: la distribution est la distribution de Dans ce cas, est la distribution exponentielle et est la -ième puissance d'une distribution exponentielle . $1-F(x)$

(1 - F (x)) = \exp {- a x - \frac{b}{p + 1} x^{p + 1}} = \underset{1 - F_{1} (x)}{\underset{⏟}{\exp {- a x}}} \underset{1 - F_{2} (x)}{\underset{⏟}{\exp {- \frac{b}{p + 1} x^{p + 1}}}}

$(1-F(x))=\exp\left\{-ax-\frac{b}{p+1}x^{p+1}\right\}=\underbrace{\exp\left\{-ax\right\}}_{1-F_1(x)}\underbrace{\exp\left\{-\frac{b}{p+1}x^{p+1}\right\}}_{1-F_2(x)}$

F

$F$

X = min {X_{1}, X_{2}} X_{1} \sim F_{1}, X_{2} \sim F_{2}

$X=\min\{X_1,X_2\}\qquad X_1\sim F_1\,,X_2\sim F_2$

F_{1}

$F_1$

E (a)

$\mathcal{E}(a)$

F_{2}

$F_2$

1 / (p + 1)

$1/(p+1)$

E (b / (p + 1))

$\mathcal{E}(b/(p+1))$

Le code R associé est aussi simple que possible

x=pmin(rexp(n,a),rexp(n,b/(p+1))^(1/(p+1))) #simulating an n-sample

et il est nettement plus rapide que les résolutions PDF inverses et acceptation-rejet:

> n=1e6
> system.time(results <- Vectorize(simulate,"prob")(runif(n)))
utilisateur     système      écoulé 
    89.060       0.072      89.124 
> system.time(x <- simuF(n,1,2,3))
utilisateur     système      écoulé 
     1.080       0.020       1.103 
> system.time(x <- pmin(rexp(n,a),rexp(n,b/(p+1))^(1/(p+1))))
utilisateur     système      écoulé 
     0.160       0.000       0.163

avec un ajustement parfait sans surprise:

— Xi'an
source

5

solution vraiment cool!

— Sebastian

14

Vous pouvez toujours résoudre numériquement la transformation inverse.

Ci-dessous, je fais une recherche de bissection très simple. Pour une probabilité d'entrée donnée (j'utilise puisque vous avez déjà un dans votre formule), je commence par et . Ensuite, je double jusqu'à . Enfin, je bissecte itérativement l'intervalle jusqu'à ce que sa longueur soit plus courte que et que son point milieu satisfasse . $q$ $q$ $p$ $x_L=0$ $x_R=1$ $x_R$ $F(x_R)>q$ $[x_L,x_R]$ $\epsilon$ $x_M$ $F(x_M)\approx q$

L'ECDF s'adapte assez bien à votre pour mes choix de et , et c'est assez rapide. Vous pourriez probablement accélérer cela en utilisant une optimisation de type Newton au lieu de la recherche de bissection simple. $F$ $a$ $b$

aa <- 2
bb <- 1
pp <- 0.1

cdf <- function(x) 1-exp(-aa*x-bb*x^(pp+1)/(pp+1))

simulate <- function(prob,epsilon=1e-5) {
    left <- 0
    right <- 1
    while ( cdf(right) < prob ) right <- 2*right

    while ( right-left>epsilon ) {
        middle <- mean(c(left,right))
        value_middle <- cdf(middle)
        if ( value_middle < prob ) left <- middle else right <- middle
    }

    mean(c(left,right))
}

set.seed(1)
results <- Vectorize(simulate,"prob")(runif(10000))
hist(results)

xx <- seq(0,max(results),by=.01)
plot(ecdf(results))
lines(xx,cdf(xx),col="red")

— S. Kolassa - Réintégrer Monica
source

10

Il y a une résolution quelque peu compliquée si directe par acceptation-rejet. Tout d'abord, une différenciation simple montre que le pdf de la distribution est Deuxièmement, puisque nous avons la borne supérieure Troisièmement, considérant le deuxième terme en , prendre le changement de variable , c'est-à-dire . Alors est le jacobien du changement de variable. Si

f (x) = (a + b x^{p}) \exp {- a x - \frac{b}{p + 1} x^{p + 1}}

$f(x)=(a+bx^p)\exp\left\{-ax-\frac{b}{p+1}x^{p+1}\right\}$

f (x) = a e^{- a x} \underset{\leq 1}{\underset{⏟}{e^{- b x^{p + 1} / (p + 1)}}} + b x^{p} e^{- b x^{p + 1} / (p + 1)} \underset{\leq 1}{\underset{⏟}{e^{- a x}}}

$f(x)=ae^{-ax}\underbrace{e^{-bx^{p+1}/(p+1)}}_{\le 1}+bx^pe^{-bx^{p+1}/(p+1)}\underbrace{e^{-ax}}_{\le 1}$

f (x) \leq g (x) = a e^{- a x} + b x^{p} e^{- b x^{p + 1} / (p + 1)}

$f(x)\le g(x)=ae^{-ax}+bx^pe^{-bx^{p+1}/(p+1)}$

g

$g$

ξ = x^{p + 1}

$\xi=x^{p+1}$

x = ξ^{1 / (p + 1)}

$x=\xi^{1/(p+1)}$

\frac{d x}{d ξ} = \frac{1}{p + 1} ξ^{\frac{1}{p + 1} - 1} = \frac{1}{p + 1} ξ^{\frac{- p}{p + 1}}

$\dfrac{\text{d}x}{\text{d}\xi}=\dfrac{1}{p+1}\xi^{\frac{1}{p+1}-1}=\dfrac{1}{p+1}\xi^{\frac{-p}{p+1}}$

X

$X$ a une densité de la forme où est la constante de normalisation, alors a la densité ce qui signifie que (i) est distribué comme une variable exponentielle et (ii) la constante est égale à un. Par conséquent, finit par être égal au mélange également pondéré d'une distribution exponentielle et de la puissance -ième d'une puissance exponentielle

κ b x^{p} e^{- b x^{p + 1} / (p + 1)}

$\kappa bx^pe^{-bx^{p+1}/(p+1)}$

κ

$\kappa$

Ξ = X^{1 / (p + 1)}

$\Xi=X^{1/(p+1)}$

κ b ξ^{\frac{p}{p + 1}} e^{- b ξ / (p + 1)} \frac{1}{p + 1} ξ^{\frac{- p}{p + 1}} = κ \frac{b}{p + 1} e^{- b ξ / (p + 1)}

$\kappa b\xi^{\frac{p}{p+1}}e^{-b\xi/(p+1)}\,\dfrac{1}{p+1}\xi^{\frac{-p}{p+1}}=\kappa \dfrac{b}{p+1}e^{-b\xi/(p+1)}$

Ξ

$\Xi$

E (b / (p + 1))

$\mathcal{E}(b/(p+1))$

κ

$\kappa$

g (x)

$g(x)$

E (a)

$\mathcal{E}(a)$

1 / (p + 1)

$1/(p+1)$

E (b / (p + 1))

$\mathcal{E}(b/(p+1))$ distribution, modulo une constante multiplicative manquante de pour tenir compte des poids: Et est simple à simuler comme un mélange.

2

$2$

f (x) \leq g (x) = 2 (\frac{1}{2} a e^{- a x} + \frac{1}{2} b x^{p} e^{- b x^{p + 1} / (p + 1)})

$f(x)\le g(x)=2\left(\frac{1}{2} ae^{-ax}+\frac{1}{2} bx^pe^{-bx^{p+1}/(p+1)}\right)$

g

$g$

Un rendu R de l'algorithme d'acceptation-rejet est donc

simuF <- function(a,b,p){
  reepeat=TRUE
  while (reepeat){
   if (runif(1)<.5) x=rexp(1,a) else
      x=rexp(1,b/(p+1))^(1/(p+1))
   reepeat=(runif(1)>(a+b*x^p)*exp(-a*x-b*x^(p+1)/(p+1))/
      (a*exp(-a*x)+b*x^p*exp(-b*x^(p+1)/(p+1))))}
  return(x)}

et pour un n-échantillon:

simuF <- function(n,a,b,p){
  sampl=NULL
  while (length(sampl)<n){
   x=u=sample(0:1,n,rep=TRUE)
   x[u==0]=rexp(sum(u==0),b/(p+1))^(1/(p+1))
   x[u==1]=rexp(sum(u==1),a)
   sampl=c(sampl,x[runif(n)<(a+b*x^p)*exp(-a*x-b*x^(p+1)/(p+1))/
      (a*exp(-a*x)+b*x^p*exp(-b*x^(p+1)/(p+1)))])
   }
  return(sampl[1:n])}

Voici une illustration pour a = 1, b = 2, p = 3:

— Xi'an
source