Quel test statistique doit être utilisé pour tester l'enrichissement des listes de gènes?


10

J'ai effectué une expérience pour tester la sensibilité cellulaire à un certain agent de dégradation de l'ADN. Nous avons trouvé 270 gènes qui étaient spécifiquement sensibles au médicament et le nombre total de gènes analysés était de 3668. 38 des 270 gènes sensibles sont classés comme «gènes de réparation de l'ADN». Si le nombre de "gènes de réparation de l'ADN" contenus dans le génome est de 112 et que le nombre total de gènes dans le génome est de 3668, les gènes sensibles sont-ils enrichis en gènes de réparation de l'ADN? Quel test statistique doit être utilisé? J'apprécierais si vous pouviez également me dire un outil pour calculer la valeur de p en ligne.

Réponses:


17

La pratique standard pour tester l'enrichissement des listes de gènes est de faire un test hypergéométrique ou, de manière équivalente, un test exact unilatéral de Fisher . Vous disposez du tableau de contingence suivant:2×2

DNA RepairOtherSensitive38232270Not Sensitive74332433981123556

Vous pouvez effectuer le test Rcomme suit:

fisher.test(matrix(c(38,74,232,3324),nrow=2,ncol=2),alternative="greater")

Ce qui donne un résultat très significatif:

Fisher's Exact Test for Count Data

data:  matrix(c(38, 74, 232, 3324), nrow = 2, ncol = 2) 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is greater than 1 
95 percent confidence interval:
5.062107      Inf 
sample estimates:
odds ratio 
7.34918

Notez que lorsque nous testons la surreprésentation (plutôt que la sous-représentation), le alternativeparamètre est défini sur "greater".


1
Merci beaucoup pour votre réponse. J'ai également pensé que le test de Fisher pourrait être une bonne méthode pour l'analyse. Je n'ai pas de logiciel statistique pour effectuer les résultats pour d'autres classes fonctionnelles que je voudrais également tester. Connaissez-vous un outil "en ligne" pour obtenir les valeurs p avec toutes les décimales?
Laura

1
Vous pouvez télécharger R gratuitement. Voir r-project.org Donc, ne pas avoir de logiciel est soluble (et penser que vous avez besoin d'un moyen de calcul en ligne est incorrect). Mais veuillez faire une petite recherche pour découvrir ces choses par vous-même. Consultez les conseils sur stats.stackexchange.com/help/how-to-ask pour poser une bonne question.
Nick Cox

@Nick Vos conseils sont bons, mais veuillez ne pas les présenter comme une caractérisation de l'affiche: un tel libellé est trop facilement mal compris comme une attaque, ce que je doute que vous vouliez. J'ai donc supprimé la phrase préliminaire dans votre commentaire (qui n'y a ajouté aucune information).
whuber

Un excellent outil en ligne pour cela est: mathcelebrity.com/fishers_exact_test.php

Pourriez-vous expliquer en outre la surreprésentation de ce qui est calculé exactement?
sdgaw erzswer
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.