Quelle distribution utiliser pour modéliser l'heure avant l'arrivée d'un train?

15

J'essaie de modéliser certaines données sur les heures d'arrivée des trains. Je voudrais utiliser une distribution qui capture "plus j'attends, plus le train va apparaître" . Il semble qu'une telle distribution devrait ressembler à un CDF, de sorte que P (train apparaîtra | attendu 60 minutes) soit proche de 1. Quelle distribution est appropriée à utiliser ici?

distributions modeling

— foobar
source

10

Si vous attendez 25 heures et qu'il n'y a pas eu de train, je soupçonne que la chance qu'un train se présente dans la minute suivante soit proche de

0

$0$ car il est fort possible que la ligne ait été fermée temporairement ou définitivement

— Henry

@Henry, cela dépend entièrement de votre confiance dans les probabilités antérieures. Par exemple, la gare la moins fréquentée de Grande-Bretagne, theguardian.com/uk-news/2016/dec/09/… , a des lacunes d'arrivées depuis plus d'une journée (le dimanche il n'y a pas de service).

— Sextus Empiricus

@MartijnWeterings - peut-être grâce aux journalistes, Shippea Hill a vu une augmentation de 1200% de son utilisation et n'a même pas atteint les 10 plus faibles usages l'année suivante , dont certains, comme l'aéroport de Teesside, ont un train par semaine dans une direction

— Henry

17

Multiplication de deux probabilités

La probabilité d'une première arrivée à un instant compris entre $t$ et $t+dt$ (le temps d'attente) est égale à la multiplication de

la probabilité d'une arrivée entre $t$ et $t+dt$ (qui peut être liée au taux d'arrivée $s(t)$ au temps $t$ )
et la probabilité de non arrivée avant l'instant $t$ (ou sinon ce ne serait pas le premier).

Ce dernier terme est lié à:

P (n = 0, t + d t) = (1 - s (t) d t) P (n = 0, t)

$P(n=0,t+dt) = (1-s(t)dt) P(n=0,t)$

ou

\frac{\partial P (n = 0, t)}{\partial t} = - s (t) P (n = 0, t)

$\frac{\partial P(n=0,t)}{\partial t} = -s(t) P(n=0,t)$

donnant:

P (n = 0, t) = e^{\int_{0}^{t} - s (t) d t}

$P(n=0,t) = e^{\int_0^t-s(t) dt}$

et la distribution de probabilité pour les temps d'attente est:

f (t) = s (t) e^{\int_{0}^{t} - s (t) d t}

$f(t) = s(t)e^{\int_0^t-s(t) dt}$

Dérivation de la distribution cumulative.

Vous pouvez également utiliser l'expression pour la probabilité de moins d'une arrivée conditionnelle à ce que le temps soit $t$

P (n < 1 | t) = F (n = 0; t)

$P(n<1|t) = F(n=0;t)$

et la probabilité d'arrivée entre l'instant $t$ et $t+dt$ est égale à la dérivée

f_{arrival time} (t) = - \frac{d}{d t} F (n = 0 | t)

$f_{\text{arrival time}}(t) = - \frac{d}{d t} F(n=0 \vert t)$

Cette approche / méthode est par exemple utile pour dériver la distribution gamma comme le temps d'attente pour la n-ième arrivée dans un processus de Poisson. ( temps-d'attente-du-processus-de-poisson-suit-la distribution gamma )

Deux exemples

Vous pourriez relier cela au paradoxe de l'attente ( veuillez expliquer le paradoxe de l'attente ).

$s(t) = \lambda$
$f (t) = λ e^{- λ t}$ $f(t) = \lambda e^{-\lambda t}$
$T$ $t$ $s(t) = 1/(T-t)$
$f (t) = \frac{e^{\int_{0}^{t} - \frac{1}{T - t} d t}}{T - t} = \frac{1}{T}$ $f(t)= \frac{e^{\int_0^t -\frac{1}{T-t} dt}}{T-t} = \frac{1}{T}$ $0$ $T$

C'est donc ce deuxième cas, avec "alors la probabilité d'une arrivée, alors qu'une personne attend déjà depuis un certain temps augmente" , qui se rapporte à votre question.

$s(t) dt$ pour qu'un train arrive à un certain moment pourrait être une fonction plus complexe.

Écrit par StackExchangeStrike

— Sextus Empiricus
source

7

La distribution classique pour modéliser les temps d'attente est la distribution exponentielle .

La distribution exponentielle se produit naturellement lors de la description des longueurs des temps entre arrivées dans un processus de Poisson homogène.

— Stephan Kolassa
source

2

Oui, mais je suppose qu'un processus de Poisson n'est pas un bon modèle pour un réseau ferroviaire.

— leftaroundabout