Existe-t-il une version de test d'équivalence simple du test de Kolmogorov – Smirnov?


13

Deux tests unilatéraux d'équivalence (TOST) ont-ils été élaborés pour le test de Kolmogorov-Smirnov afin de tester l'hypothèse nulle négativiste selon laquelle deux distributions diffèrent d'au moins un certain niveau spécifié par les chercheurs?

Si ce n'est pas TOST, alors une autre forme de test d'équivalence?

Nick Stauner souligne judicieusement que (je devrais déjà le savoir;) qu'il existe d'autres tests d'équivalence TOST non paramétriques pour les hypothèses nulles d'équivalence stochastique et, avec des hypothèses plus restrictives, pour l'équivalence médiane.


Réponses:


9

Ok, voici ma première tentative. Un examen attentif et des commentaires appréciés!

Les hypothèses à deux échantillons
Si nous pouvons encadrer les tests d'hypothèse de Kolmogorov-Smirnov à deux échantillons , avec des hypothèses nulles et alternatives le long de ces lignes:

H 0F Y ( t )F X ( t ) , et0FY(t)FX(t)

H AF Y ( t ) < F X ( t ) , pour au moins un t , où:AFY(t)<FX(t)t

  • la statistique de test D - = | min t ( F Y ( t ) - F X ( t ) ) | D=|mint(FY(t)FX(t))| correspond à H 0F Y ( t )F X ( t ) ;0FY(t)FX(t)

  • la statistique de test D + = | max t ( F Y ( t ) - F X ( t ) ) | D+=|maxt(FY(t)FX(t))|correspond à H 0F Y ( t )F X ( t ) ; et0FY(t)FX(t)

  • F Y ( t )FY(t) & F X ( t )FX(t) sont lesCDF empiriquesdes échantillons YY et XX ,

alors il devrait être raisonnable de créer une hypothèse d'intervalle générale pour un test d'équivalence le long de ces lignes (en supposant que l'intervalle d'équivalence est symétrique pour le moment):

H - 0| F Y ( t ) - F X ( t ) | Δ , et0|FY(t)FX(t)|Δ

H - A| F Y ( t ) - F X ( t ) | < Δ , pour au moins un t .A|FY(t)FX(t)|<Δt

Cela se traduirait par au particulier deux sens unique hypothèses nulles « de négativistes » pour tester l' équivalence (ces deux hypothèses prennent la même forme, puisque les deux D + et D - sont strictement non-négatif):D+D

H - 01D +Δ , ou01D+Δ

H - 02D -Δ .02DΔ

Rejeter à la fois H - 01 et H - 02 conduirait à conclure que - Δ < F Y ( t ) - F X ( t ) < Δ . Bien entendu, l'intervalle d'équivalence n'a pas besoin d'être symétrique, et - Δ et Δ pourraient être remplacés par Δ 2 (inférieur) et Δ 1 (supérieur) pour les hypothèses nulles unilatérales respectives.01 02Δ<FY(t)FX(t)<ΔΔΔΔ2Δ1

Les statistiques de test (mises à jour: Delta est en dehors du signe de la valeur absolue)
Les statistiques de test D + 1 et D - 2 (en laissant implicitement les n Y et n X ) correspondent à H - 01 et H - 02 , respectivement, et sont:D+1D2nYnX0102

D + 1 = Δ - D + = Δ - | max t [ ( F Y ( t ) - F X ( t ) ) ] | , etD+1=ΔD+=Δ|maxt[(FY(t)FX(t))]|

D - 2 = Δ - D - = Δ - | min t [ ( F Y ( t ) - F X ( t ) ) ] |D2=ΔD=Δ|mint[(FY(t)FX(t))]|

Le seuil d'équivalence / pertinence
L'intervalle [ - Δ , Δ ] - ou [ Δ 2 , Δ 1 ] , si vous utilisez un intervalle d'équivalence asymétrique - est exprimé en unités de D + et D - , ou l'amplitude des probabilités différenciées. Lorsque n Y et n X approchent de l'infini, le CDF de D + ou D - pour n Y , n X s'approche de 0 pour t[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0< 0 , et pour t 0 :t<0t0

lim n Y , n X p + =P ( n Y n Xn Y + n X D+t)=1-e-2t2

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

CDF of $D^{+}$ (or $D^{-}$)

Il me semble donc que le PDF pour la taille d'échantillon D + (ou la taille d'échantillon D - ) doit être 0 pour t < 0 , et pour t 0 :D+D0t<0t0

f(t)=1e2t2ddt=4te2t2

f(t)=1e2t2ddt=4te2t2

PDF of $D^{+}$ (or $D^{-}$)

Glen_b points out that this is a Rayleigh distribution with σ=12σ=12. So the large sample quantile function for sample size-scaled D+D+ and DD is:

CDF1=Q(p)=ln(1p)2

CDF1=Q(p)=ln(1p)2

and a liberal choice of ΔΔ might be the critical value Qα+σ/2=Qα+14Qα+σ/2=Qα+14, and a more strict choice the critical value Qα+σ/4=Qα+18Qα+σ/4=Qα+18.


1
In the line where you pass from the cdf to the pdf, I think you got that wrong. Let KnY,nX=nYnXnY+nXD+KnY,nX=nYnXnY+nXD+, so (abusing notation), in the limit P(K,t)=1e2t2P(K,t)=1e2t2. Then fK(t)=ddt1e2t2=4te2t2fK(t)=ddt1e2t2=4te2t2 (note the tt after the 44). (note also a missing sign in the exponent in the line above the taking of the derivative. Also I'm not sure why you have an integral symbol there, but maybe I misunderstood something.)
Glen_b -Reinstate Monica

2
@stochazesthai D1D1 and D2D2 are two one-sided test statistics. Per TOST you need to reject both the null hypotheses to which these test statistics apply. QαQα is a critical value from CDF11 on the above line, and where you want to sub in 1α1α for pp (e.g. Qα=ln(1(1α))2Qα=ln(1(1α))2). The choice of ΔΔ depends on how far past QαQα (the critical rejection value for a plain old positivist H0H0) you need to go, before you conclude relevant difference (e.g. liberal 'equivalence' is 1414 σσ beyond QαQα).
Alexis

2
@stochazesthai (Continuing) So if both D1ΔD1Δ and D2ΔD2Δ, then you reject H0H0.
Alexis

2
@stochazesthai Whoops! I should have put the quotes around the word liberal rather than equivalence two comments back. :)
Alexis

2
@stochazesthai If D1ΔD1Δ, then reject H01H01, if D1<ΔD1<Δ, then fail to reject H01H01. If D2ΔD2Δ, then reject H02H02, if D2<ΔD2<Δ, then fail to reject H02H02. If reject both H01H01 and H02H02, then reject H0H0, otherwise fail to reject H0H0.
Alexis

6

An alternative to TOST in equivalence testing is based on the confidence interval approach:

Let ΔΔ denote the prespecified equivalence margin and
θ:=supt|FX(t)FY(t)|

θ:=supt|FX(t)FY(t)|
the Kolmogorov-Smirnov distance between the unknown underlying distribution functions.

Now, if a 90% confidence interval for θθ is completely within [Δ,Δ][Δ,Δ], then we may be 95% certain that θθ is enough close to 0 to speak of "equivalence".

Without knowing the underlying distributions, it seems to be hopeless to derive an approximate analytic confidence interval, so we might need to rely on (bias corrected) bootstrap confidence intervals based on resampling from pairs XX and YY. (I don't want to find conditions for their validity in this particular application though...)


Excellent. Do you have a citation for anyone undertaking the CI of Dn1,n2Dn1,n2 (bootstrap or otherwise)?
Alexis

1
Good point... The short paper tomswebpage.net/images/K-S_test.doc mentions the "Handbook of Parametric and Nonparametric Statistical Procedures, Fifth Edition by David J.Sheskin (Apr 27, 2011)." to offer a two-sample case construcion for D. But at the moment, I don't have access to this book.
Michael M
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.