Mesures répétées au fil du temps avec petit

On m'a donné des données à analyser pour une étude examinant les effets d'un traitement sur les niveaux de fer à quatre moments différents (avant le traitement, le jour de fin du traitement, 4 semaines après le traitement et 2 à 4 mois après le traitement). Il n'y a pas de groupe témoin. Ils cherchent à voir s'il y a des augmentations significatives des niveaux de fer à chacun des 3 points de temps post-traitement par rapport au niveau avant traitement (ligne de base). Onze patients avaient des niveaux de base mais seulement 8 patients avaient des données complètes pour les 4 points de temps ( = 11, 10, 9 et 8 pour chaque point de temps). Non seulement les niveaux de fer ont été mesurés, mais deux autres mesures de laboratoire ont été prises à chaque instant pour être comparées à la ligne de base. $n$

J'ai quelques questions sur la façon d'analyser cela. J'ai d'abord pensé qu'une RM ANOVA serait appropriée pour analyser ces données, mais j'étais préoccupé par la petite taille de l'échantillon, la perte de données et la distribution non normale des données. J'ai ensuite envisagé de comparer chaque mesure de post-traitement à la ligne de base à l'aide des tests de rang signé de Wilcoxon, mais j'ai ensuite rencontré le problème des comparaisons multiples. Cependant, j'ai lu de la littérature qui minimise la nécessité d'effectuer plusieurs comparaisons. Donc, dans l'ensemble, je traite de petits échantillons, de données incomplètes et de comparaisons multiples (et si cela est nécessaire ou non).

J'espère que tout cela avait du sens. Je suis nouveau sur CrossValidated et j'ai été dirigé ici par un collègue comme un endroit pour apprendre des statisticiens expérimentés, donc j'apprécierais tout conseil! Merci!

Modifié pour ajouter des données brutes du commentaire:

Il y a quatre points de temps au total et la variable de résultat est continue. Par exemple, les résultats à chaque instant ressemblent à ceci:

 Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 
 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
 2nd Post (n=9):  [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
 3rd Post (n=8):  [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]

repeated-measures multiple-comparisons wilcoxon-signed-rank

— msturm17
source

Si vous ajoutez un exemple reproductible (ou des données brutes), ce serait utile.

— Ladislav Naďo

La variable de résultat est continue. Par exemple, les résultats à chaque point dans le temps ressemblent à ceci: Niveaux de référence n = 11: [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]. 1er poste n = 10 [167, 200, 45, 132,., 245, 199, 177, 134, 298, 111]. 2e poste n = 9 [75, 43, 23, 98, 87,., 300,., 118, 202, 156]. 3e niveau de poste n = 8 [23, 34, 98, 112,., 200,., 156, 54, 18,.]. Il y a quatre points de temps au total.

— msturm17

Réponses:

J'ai repensé votre problème et trouvé le test de Friedman qui est une version non paramétrique d'une ANOVA unidirectionnelle avec des mesures répétées .

J'espère que vous avez des compétences de base R.

# Creating a source data.frame
my.data<-data.frame(value=c(2,7,7,3,6,3,2,4,4,3,14,167,200,45,132,NA,
245,199,177,134,298,111,75,43,23,98,87,NA,300,NA,118,202,156,23,34,98,
112,NA,200,NA,156,54,18,NA),
post.no=rep(c("baseline","post1","post2","post3"), each=11),
ID=rep(c(1:11), times=4))

# you must install this library
library(pgirmess)

Effectuer le test Test de Friedman ...

friedman.test(my.data$value,my.data$post.no,my.data$ID)

    Friedman rank sum test

data:  my.data$value, my.data$post.no and my.data$ID
Friedman chi-squared = 14.6, df = 3, p-value = 0.002192

puis trouver entre quels groupes la différence existe par un test post-hoc non paramétrique . Ici, vous avez toutes les comparaisons possibles.

friedmanmc(my.data$value,my.data$post.no,my.data$ID)
Multiple comparisons between groups after Friedman test 
p.value: 0.05 
Comparisons
               obs.dif critical.dif difference
baseline-post1      25     15.97544       TRUE
baseline-post2      21     15.97544       TRUE
baseline-post3      20     15.97544       TRUE
post1-post2          4     15.97544      FALSE
post1-post3          5     15.97544      FALSE
post2-post3          1     15.97544      FALSE

Comme vous pouvez le voir, seule la ligne de base (premier point de temps) est statistiquement différente des autres.

J'espère que cela t'aidera.

— Ladislav Naďo
source

Ladislav, c'est une excellente réponse à cette question. Il est extrêmement complet et complet. Le seul problème que je vois est que les ANOVA de Kruskal-Wallis ont également une hypothèse d'indépendance des observations, de sorte qu'il y a différents sujets à chaque niveau de la variable indépendante, ce que dans ce cas, nous n'avons pas car nous suivons les mêmes 11 patients sur 4 points de temps. Avez-vous une opinion à ce sujet ou avez-vous d'autres méthodes en tête pour résoudre ce problème? Merci beaucoup!

— Matt Reichenbach

J'ai supprimé mon commentaire ci-dessus. J'ai finalement trouvé un meilleur test. Prendre plaisir !

— Ladislav Naďo

Ce n'est pas ma question d'origine, @ msturm17, devra accepter votre réponse, je vous ai quand même donné la prime!

— Matt Reichenbach

Merci, Ladislav, d'avoir pris le temps de bien répondre à ma question!

— msturm17

Si vous ne connaissez pas la distribution des changements individuels au fil du temps, vous ne pouvez pas l'approcher avec la distribution des différences entre les patients. Par exemple, si vous avez 10 patients avec des niveaux de fer respectifs (510,520, ..., 600) avant le traitement et (520,530, ..., 610) après le traitement, l'ANOVA de Kruskal-Wallis (ou tout autre algorithme similaire) revendiquerait qu'il n'y a pas de changement significatif des niveaux de fer.

À mon humble avis, sans le groupe témoin, le mieux que vous puissiez faire est de compter le nombre de patients qui ont augmenté leur taux de fer et le nombre de ceux qui l'ont diminué, et d'en tester la signification.

Cela dit, si la KW ANOVA vous dit qu'il y a un niveau de fer important, c'est (pas de faux positifs).

— user31264
source

Pas de faux positifs! Haha, merci pour ta réponse. Comment proposez-vous de «tester la signification de cela» en ce qui concerne le comptage du nombre de patients qui ont augmenté leur taux de fer et combien l'ont diminué? Merci!

— Matt Reichenbach

m

$m$

n

$n$

p = 2^{- (m + n)} \sum_{k = 0}^{m} (\binom{m + n}{k})

$p = 2^{-(m+n)} \sum_{k=0}^m {m+n \choose k}$

Je vous remercie! C'était une autre façon intéressante d'examiner ma question et je verrai comment elle s'applique à mes données.

— msturm17