Test statistique de valeur prédictive positive et négative

Je lisais un article et j'ai vu un tableau avec une comparaison entre PPV (Positive Predictive Value) et NPV (Negative Predictive Value). Ils ont fait une sorte de test statistique pour eux, voici un croquis du tableau:

PPV    NPV    p-value
65.9   100    < 0.00001
...

Chaque ligne fait référence à un tableau de contingence particulier.

Quel genre de test d'hypothèse ont-ils fait? Merci!

epidemiology contingency-tables p-value

— Simone
source

En supposant une classification croisée comme celle illustrée ci-dessous (ici, pour un instrument de dépistage)

texte alternatif

nous pouvons définir quatre mesures de la précision du dépistage et du pouvoir prédictif:

Sensibilité (se), a / (a + c), c'est-à-dire la probabilité que l'écran fournisse un résultat positif étant donné que la maladie est présente;
Spécificité (sp), d / (b + d), c'est-à-dire la probabilité que l'écran fournisse un résultat négatif étant donné que la maladie est absente;
Valeur prédictive positive (VPP), a / (a + b), c'est-à-dire la probabilité de patients avec des résultats de test positifs qui sont correctement diagnostiqués (comme positifs);
Valeur prédictive négative (VAN), d / (c + d), c'est-à-dire la probabilité de patients avec des résultats de test négatifs qui sont correctement diagnostiqués (comme négatifs).

Les quatre mesures sont des proportions simples calculées à partir des données observées. Un test statistique approprié serait donc un test binomial (exact) , qui devrait être disponible dans la plupart des progiciels statistiques ou dans de nombreuses calculatrices en ligne. L'hypothèse testée est de savoir si les proportions observées diffèrent significativement de 0,5 ou non. J'ai trouvé cependant plus intéressant de fournir des intervalles de confiance plutôt qu'un seul test de signification, car il donne des informations sur la précision de la mesure. Quoi qu'il en soit, pour reproduire les résultats que vous avez montrés, vous devez connaître les marges totales de votre tableau bidirectionnel (vous n'avez donné que le PPV et le NPV en%).

À titre d'exemple, supposons que nous observions les données suivantes (le questionnaire CAGE est un questionnaire de dépistage de l'alcool):

texte alternatif

alors dans R le PPV serait calculé comme suit:

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831

Si vous utilisez SAS, vous pouvez consulter la note d'utilisation 24170: comment estimer la sensibilité, la spécificité, les valeurs prédictives positives et négatives, les probabilités faussement positives et négatives et les rapports de vraisemblance? .

Pour calculer les intervalles de confiance, l'approximation gaussienne, (1,96 étant le quantile de la distribution normale standard à ou avec %), est utilisé en pratique, surtout lorsque les proportions sont assez petites ou grandes (ce qui est souvent le cas ici). $p \pm 1.96 \times \sqrt{p(1-p)/n}$ $p=0.975$ $1-\alpha/2$ $\alpha=5$

Pour plus de référence, vous pouvez consulter

Newcombe, RG. Intervalles de confiance bilatéraux pour la proportion unique: comparaison de sept méthodes . Statistics in Medicine , 17, 857-872 (1998).

— chl
source

Merci. Ok, j'ai lu au tout début de l'article qu'ils utilisaient le test du chi carré pour toutes les variables catégorielles. La table de classification écrite ne fait pas référence à une variable en particulier, elle est la sortie d'une tâche de classification. Ce n'est pas très clair! Maintenant, je suppose qu'ils ont fait un test classique sur la proportion .. peut-être Chi-carré ..

— Simone

J'ai jeté un coup d'œil à cette question et j'ai vu que la valeur de p ne fait référence ni au PPV ni au NPV, elle se réfère à la ligne entière. Je pense que le test qu'ils ont dû être associé à l'ensemble du tableau de contingence.

— Simone

@Simone Donc, si je vous comprends bien, vous suggérez que les auteurs fournissent des valeurs PPV et NPV mais donnent la valeur p correspondant à un test d'association globale du tableau 2x2? Est-ce lié à cette question récente, stats.stackexchange.com/questions/9464/… ?

— chl

Oui, il serait lié à cette question si la valeur de p était associée soit au PPV soit au NPV. Et dans ce cas, vous avez donné la solution. Le test correspond à l'ensemble du tableau 2x2, je ne saurai jamais de quel type de test il s'agit!

— Simone

S'il te plait regarde

Kosinski, Andrzej S. Une statistique de score généralisée pondérée pour la comparaison des valeurs prédictives des tests de diagnostic. Statistics in Medicine http://dx.doi.org/10.1002/sim.5587 publié en ligne: 22 août 2012

— Andrzej Kosinski
source