Intuition derrière le taux de risque


16

Je suis confus quant à l'équation qui sert de définition du taux de risque. J'ai une idée de ce qu'est le taux de risque, mais je ne vois tout simplement pas comment l'équation exprime cette intuition.

Si x est une variable aléatoire qui représente le moment du décès d'une personne sur un intervalle de temps [0,T] . Le taux de risque est alors:

h(X)=F(X)1-F(X)

F(X) représente la probabilité de décès jusqu'à ce point dans le temps X[0,T] ,
1-F(X) représente la probabilité d'avoir survécu jusqu'au point temporel X[0,T] ,
et F(X) est la probabilité de décès au point X .

Comment la division de par le taux de survie explique-t-elle l'intuition de la probabilité de mort instantanée dans le prochain Δ t ? Ne devrait-il pas simplement être f ( x ) , ce qui rend le calcul du taux de risque trivial?f(x)Δtf(x)

Réponses:


11

Soit le moment du décès (ou le moment de l'échec si vous préférez une description moins morbide). Supposons que X est une variable aléatoire continue dont la fonction de densité f ( t ) est non nulle uniquement sur ( 0 , ) . Maintenant, notez que ce doit être le cas que f ( t ) se désintègre à 0 en tant que t parce que si f ( t ) ne se désintègre pas comme indiqué, alors - (XXf(t)(0,)f(t)0tf(t) ne peut pas tenir. Ainsi, votre idée quef(T)est la probabilité de décès au tempsT (en fait, c'estf(T)Δtqui est (approximativement) la probabilité de décès dans l'intervallecourt(T,T+Δt] de la longueurΔt) conduit à des conclusions invraisemblables et incroyables telles quef(t)dt=1f(T)Tf(T)Δt(T,T+Δt]Δt

Vous êtes plus susceptible de mourir dans le mois suivant lorsque vous avez trente ans que lorsque vous avez quatre-vingt-dix-huit ans.

chaque fois que est tel que f ( 30 ) > f ( 98 ) .f(t)f(30)>f(98)

La raison pour laquelle (ou f ( T ) Δ t ) est la "mauvaise" probabilité à considérer est que la valeur de f ( T ) n'intéresse que ceux qui sont vivants à l'âge T (et encore mentalement assez alerte pour lire régulièrement stats.SE!) Ce qui doit être examiné est la probabilité qu'un T âgé de 1 an décède dans le mois suivant, c'est-à-diref(T)f(T)Δtf(T)TT

P{(X(T,T+Δt]XT}=P{(X(T,T+Δt])(XT)}P{XT} definition of conditional probability=P{X(T,T+Δt]}P{XT}=f(T)Δt1F(T)because X is a continuous rv

En choisissant comme étant une quinzaine, une semaine, un jour, une heure, une minute, etc., nous arrivons à la conclusion que le taux de risque (instantané) pour un T âgé deΔtT

h(T)=f(T)1F(T)

en ce sens que la probabilité approximative de décès dans la femtoseconde suivante d'un T- year old est f ( T ) Δ t(Δt)Tf(T)Δt1F(T).

Note that in contrast to the density f(t) integrating to 1, the integral 0h(t)dt must diverge. This is because the CDF F(t) is related to the hazard rate through

F(t)=1exp(0th(τ)dτ)
and since limtF(t)=1, it must be that
limt0th(τ)dτ=,
or stated more formally, the integral of the hazard rate must diverge: there is no potential divergence as a previous edit claimed.

Typical hazard rates are increasing functions of time, but constant hazard rates (exponential lifetimes) are possible. Both of these kinds of hazard rates obviously have divergent integrals. A less common scenario (for those who believe that things improve with age, like fine wine does) is a hazard rate that decreases with time but slowly enough that the integral diverges.


"Let X denote the time of death (or time of failure if you prefer a less morbid description". Time until recovery is even less morbid.
ryu576

10

Imagine that you are interested in the incidence of (first) marriage for men. To look at the incidence of marriage at age 20, say, you would select a sample of people who are not married at that age and see if they get married within the next year (before they turn 21).

The you could get a rough estimate for

P(marrybefore21|notmarriedat20)
as the proportion of individuals who got married from your sample of single 20 year olds, i.e.
N(marriedbefore21andnotmarriedat20)N(notmarriedat20)

So basically this is just using the definition of conditional probability,

P(X|Y)=P(X,Y)P(Y).
Now imagine we make the age unit smaller and smaller, up to days for example. I.e. what is the incidence of marriage at age of 7300 days? Then you would do the same, but survey all individuals of 7300 days and look who gets married before the end of the day. If T is a random variable age at marriage, then we could write
P(T7301)|T7300)=P(T[7300,7301))P(T7300)
by the same logic as before.

The hazard would then be the instantaneous probability of marriage at age t, for a non-married individual. We can write this as

h(t)dt=P(T[t,t+dt)|Tt)=P(T[t,t+dt))P(Tt)

5

f(x) is not the probability of death, but the probability density; the expected number of times you die within the next unit of time if the probability density remained constant during that unit of time.

Notice there is a problem: your probability of dying when you already died before is rather problematic. So it makes more sense to compute the probability of dying conditional on having survived thus far. 1F(t) it the probability of having survived until t, so dividing the probabilty density by that probability, will get us the expected number of times we will die within the next unit of time conditional on not having died before. That is the hazard rate.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.