Comparaison de la variance des observations appariées

16

J'ai $N$ observations appariées ( , ) tirées d'une distribution inconnue commune, qui a des premier et deuxième moments finis, et est symétrique autour de la moyenne. $X_i$ $Y_i$

Soit l'écart type de (inconditionnel à ), et même pour Y. Je voudrais tester l'hypothèse $\sigma_X$ $X$ $Y$ $\sigma_Y$

$H_0$ : $\sigma_X = \sigma_Y$

$H_1$ : $\sigma_X \neq \sigma_Y$

Quelqu'un connaît-il un tel test? Je peux supposer en première analyse que la distribution est normale, bien que le cas général soit plus intéressant. Je recherche une solution de forme fermée. Bootstrap est toujours un dernier recours.

— gappy
source

3

Je ne sais pas pourquoi l'information que les observations sont appariées est importante pour l'hypothèse testée; pourriez-vous expliquer?

— russellpierce

1

@drknexus c'est important car la dépendance rend difficile le calibrage du test de Fisher.

— Robin Girard

4

Vous pouvez utiliser le fait que la distribution de la variance de l'échantillon est une distribution du khi carré centrée sur la vraie variance. Sous votre hypothèse nulle, votre statistique de test serait la différence de deux variables aléatoires chi carré centrées sur la même variance vraie inconnue. Je ne sais pas si la différence de deux variables aléatoires chi carré est une distribution identifiable, mais ce qui précède peut vous aider dans une certaine mesure.

3

@svadali, il est plus habituel d'utiliser ratio ici car la distribution du ratio du chi carré est tabulée (Fisher's F). Cependant, la partie problématique de la question (c'est-à-dire la dépendance entre

et

) est toujours là quoi que vous utilisiez. Il n'est pas simple de construire un test avec deux chi carrés dépendants ... J'ai essayé de donner une réponse avec une solution sur ce point (voir ci-dessous).

X

$X$

Y

$Y$

— robin girard

7

Si vous souhaitez emprunter la route non paramétrique, vous pouvez toujours essayer le test des rangs au carré.

Pour le cas non apparié, les hypothèses pour ce test (prises à partir d' ici ) sont:

Les deux échantillons sont des échantillons aléatoires de leurs populations respectives.
En plus de l'indépendance au sein de chaque échantillon, il existe une indépendance mutuelle entre les deux échantillons.
L'échelle de mesure est au moins un intervalle.

Ces notes de cours décrivent en détail le cas non apparié.

Pour le boîtier jumelé, vous devrez modifier légèrement cette procédure. Au milieu de cette page, vous devriez savoir par où commencer.

— csgillespie
source

6

L'approche la plus naïve que je peux penser est régresse vs en , puis effectuer une -test sur l'hypothèse . Voir test t pour la pente de régression . $Y_i$ $X_i$ $Y_i \sim \hat{m}X_i + \hat{b}$ $t$ $m = 1$

Une approche moins naïve est le test Morgan-Pitman. Soit puis effectuez un test du coefficient de corrélation de Pearson entre et . (On peut le faire simplement en utilisant la transformée Fisher RZ , qui donne les intervalles de confiance autour du coefficient de Pearson de l'échantillon, ou via un bootstrap.) $U_i = X_i - Y_i, V_i = X_i + Y_i,$ $U_i$ $V_i$

Si vous utilisez R, et que vous ne voulez pas avoir à tout coder vous-même, j'utiliserais le bootdpcipackage Robust Stats de Wilcox, WRS. (voir la page de Wilcox .)

— shabbychef
source

4

Si vous pouvez supposer une normalité bivariée, vous pouvez développer un test de rapport de vraisemblance comparant les deux structures de matrice de covariance possibles. Les estimations du maximum de vraisemblance sans contrainte (H_a) sont bien connues - juste la matrice de covariance de l'échantillon, les contraintes (H_0) peuvent être dérivées en écrivant la probabilité (et ce sera probablement une sorte d'estimation "groupée").

Si vous ne voulez pas dériver les formules, vous pouvez utiliser SAS ou R pour ajuster un modèle de mesures répétées avec des structures de covariance de symétrie non structurées et composées et comparer les probabilités.

— Aniko
source

3

La difficulté vient clairement parce que et sont corellés (je suppose que est conjointement gaussien, comme Aniko) et vous ne pouvez pas faire de différence (comme dans la réponse de @ svadali) ou un rapport (comme dans Standard Fisher-Snedecor "F-test") parce que ceux-ci seraient de distribution dépendante , et parce que vous ne savez pas ce qu'est cette dépendance qui rend difficile de dériver la distribution sous . $X$ $Y$ $(X,Y)$ $\chi^2$ $H_0$

Ma réponse repose sur l'équation (1) ci-dessous. Étant donné que la différence de variance peut être factorisée avec une différence de valeurs propres et une différence d'angle de rotation, le test d'égalité peut être décliné en deux tests. Je montre qu'il est possible d'utiliser le test de Fisher-Snedecor ensemble avec un test sur la pente comme celle suggérée par @shabbychef à cause d'une simple propriété des vecteurs 2D gaussiennes.

Test de Fisher-Snedecor: Si pour IID variables aléatoires gaussiennes avec variance sans biais empirique et variance réelle , alors il est possible de tester si utilisant le fait que, sous le zéro, $i=1,2$ $(Z^i_{1},\dots,Z^i_{n_i} )$ $\hat{\lambda}^2_i$ $\lambda^2_i$ $\lambda_1=\lambda_2$

Elle utilise le fait que

R = \frac{{\hat{λ}}_{X}^{2}}{{\hat{λ}}_{Y}^{2}}

$R=\frac{\hat{\lambda}_X^2}{\hat{\lambda}_Y^2}$ follows a Fisher-Snedecor distribution

F (n_{1} - 1, n_{2} - 1)

$F(n_1-1,n_2-1)$

R (θ) = [\begin{matrix} \cos θ & - \sin θ \\ \sin θ & \cos θ \end{matrix}]

$R(\theta) = \begin{bmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \\ \end{bmatrix}$

λ_{1}, λ_{2} > 0

$\lambda_1,\lambda_2>0$

ϵ_{1}

$\epsilon_1$

ϵ_{2}

$\epsilon_2$

N (0, λ_{i}^{2})

$\mathcal{N}(0,\lambda_i^2)$ such that

[\begin{matrix} X \\ Y \end{matrix}] = R (θ) [\begin{matrix} ϵ_{1} \\ ϵ_{2} \end{matrix}]

$\begin{bmatrix} X \\ Y \end{bmatrix} = R(\theta)\begin{bmatrix} \epsilon_1 \\ \epsilon_2 \end{bmatrix}$ and that we have

V a r (X) - V a r (Y) = (λ_{1}^{2} - λ_{2}^{2}) (\cos^{2} θ - \sin^{2} θ) [1]

$Var(X)-Var(Y)=(\lambda_1^2-\lambda_2^2)(\cos^2 \theta -\sin^2 \theta) \;\; [1]$

Testing of $Var(X)=Var(Y)$ can be done through testing if ( $\lambda_1^2=\lambda_2^2$ or $\theta=\pi/4 \; mod \; [\pi/2]$ )

Conclusion (Answer to the question) Testing for $\lambda_1^2=\lambda_2^2$ is easely done by using ACP (to decorrelate) and Fisher Scnedecor test. Testing $\theta=\pi/4 [mod \; \pi/2]$ is done by testing if $|\beta_1|=1$ in the linear regression $Y=\beta_1 X+\sigma\epsilon$ (I assume $Y$ and $X$ are centered).

Testing wether $\left ( \lambda_1^2=\lambda_2^2 \text{ or }\theta=\pi/4 [mod \; \pi/2]\right )$ at level $\alpha$ is done by testing if $\lambda_1^2=\lambda_2^2$ at level $\alpha/3$ or if $|\beta_1|=1$ at level $\alpha/3$ .

— robin girard
source