Résumé de ma réponse. J'aime la modélisation de la chaîne de Markov, mais elle manque l'aspect "temporel". À l’autre extrémité, la focalisation sur l’aspect temporel (par exemple le temps moyen à ) passe à côté de l’aspect "transition". J'irais dans la modélisation générale suivante (qui avec l'hypothèse appropriée peut conduire à [processus de markov] [1]). De plus, il y a beaucoup de statistiques "censurées" derrière ce problème (qui est certainement un problème classique de la fiabilité des logiciels?). La dernière équation de ma réponse donne l’estimateur du maximum de vraisemblance de l’intensité du vote (+ + et au lieu de "-") pour un état de vote donné. Comme on peut le voir à partir de l'équation, c'est un intermédiaire du cas où vous estimez seulement la probabilité de transition et du cas où vous ne mesurez que le temps passé dans un état donné. J'espère que cette aide.−1
Modélisation générale (pour reformuler la question et les hypothèses).
Soit et des variables aléatoires modélisant respectivement les dates de vote et le signe de vote associé (+1 pour vote positif, -1 pour vote négatif). Le processus de vote est simplement(VDi)i≥1(Si)i≥1
Yt=Y+t−Y−t
où
Y+t=∑i=0∞1VDi≤t,Si=1 and Y−t=∑i=0∞1VDi≤t,Si=−1
La quantité importante ici est l’intention de -jump
où peut être ou et est un bon filtrage, dans le cas des genres, sans autre connaissance, ce serait :
.ϵ
λϵt=limdt→01dtP(Yϵt+dt−Yϵt=1|Ft)
ϵ−+FtFt=σ(Y+t,Y−t,VD1,…,VDY+t+Y−t,S1,…,SY+t+Y−t)
mais dans le sens de votre question, je pense que vous supposez implicitement que
Cela signifie que pour il existe une séquence déterministe tel que .
P(Yϵt+dt−Yϵt=1|Ft)=P(Yϵt+dt−Yϵt=1|Yt)
ϵ=+,−(μϵi)i∈Zλϵt=μϵYt
Dans ce formalisme, votre question peut être reformulée de la manière suivante: "il est probable que " (ou du moins la différence est-elle supérieure à seuil donné).μ+−1−μ+0>0
Sous cette hypothèse, il est facile de montrer que est un [processus de markov homogène] [3] sur avec le générateur donné parYtZQ
∀i,j∈ZQi,i+1=μ+iQi,i−1=μ−iQii=1−(μ+i+μ−i)Qij=0 if |i−j|>1
Répondre à la question (en proposant un estimat de maximum de vraisemblance pour le problème statistique)
À partir de cette reformulation, le problème est résolu en estimant et en construisant un test à partir de ses valeurs. Fixons et oublions l' indice sans perte de généralité. L’estimation de (et ) peut être faite grâce à l’observation dei(μ+i)iμ+μ−
(T1,η1),…,(Tp,ηp) où sont les longueurs des des périodes passées dans l'état (ie fois successifs avec ) et est si la question a été votée, si elle a été votée et si elle était le dernier état d'observation.TjjthpiYt=iηj+1−10
Si vous oubliez le cas du dernier état d'observation, les couples mentionnés proviennent d'une distribution dépendant de et de : elle est distribuée sous la forme (où Exp est un var aléatoire d'une distribution exponentielle et est + ou -1 en fonction de celui qui réalise le max). Ensuite, vous pouvez utiliser le lemme simple suivant (la preuve est simple):μ+iμ−i(min(Exp(μ+i),Exp(μ−i)),η)η
Lemme Si et alors et . X+⇝Exp(μ+)X−⇝Exp(μ−)T=min(X+,X−)⇝Exp(μ++μ−)P(X+1<X−)=μ+μ++μ−
Cela implique que la densité de est donnée par:
où pour est la fonction de densité d'une variable aléatoire exponentielle avec le paramètre . Il est facile de déduire de cette expression l'estimateur du maximum de vraisemblance de et :f(t,ϵ)(T,η)
f(t,ϵ)=gμ++μ−(1(ϵ=+1)∗μ++1(ϵ=−1)∗μ−μ++μ−)
gaa>0aμ+μ−
(μ^+,μ^−)=argminln(μ−+μ+)((μ−+μ+)∑i=1pTi+p)−p−ln(μ−)−p+ln(μ+)
oùet.
p−=|i:δi=−1|p+=|i:δi=+1|
Commentaires pour des approches plus avancées
Si vous voulez prendre en compte les cas où est le dernier état observé (certainement plus intelligent car lorsque vous passez par , il s'agit souvent de votre dernier score ...), vous devez modifier un peu le raisonnement. La censure correspondante est relativement classique ...i−1
Une autre approche possible peut inclure la possibilité de
- Avoir une intensité qui diminue avec le temps
- Avoir une intensité qui diminue avec le temps passé depuis le dernier vote (je préfère celui-ci. Dans ce cas, il existe une méthode classique de modélisation de la diminution de la densité ...
- Vous pouvez supposer que est une fonction lisse deμ+ii
- .... vous pouvez proposer d'autres idées!