Terrain divisé en R


8

J'ai un ensemble de données de repères et sous-échantillons dans chaque repère. J'exécute ces benchmarks et leurs sous-échantillons sur machines soumises. Les «individus» étudiés par les sous-échantillons sont les mêmes pour chaque machine sujet, et les repères sont les mêmes pour chaque machine sujet.nmp

Comment réaliser une ANOVA en R dans cette situation?

Je veux principalement calculer la moyenne totale et les intervalles de confiance. Je ne me soucie pas du tout des sous-échantillons, mais je veux reconnaître la réplication dans la confiance et les moyens finaux. Je me soucie peut-être des moyens de référence. Je ne peux pas savoir comment configurer cette anova dans R. Je veux pouvoir reproduire les moyens par calcul manuel.

Je l' ai essayé glm, anova, aovet , lmemais je suis totalement confus. Je pense que les résultats de l'ANOVA devraient être équivalents pour deux machines soumises à la moyenne imbriquée de machine / référence / point de contrôle, mais les moyens ne sortent pas les mêmes lorsque je les essaie.

Éditer:

Je commence à avoir un indice sur http://zoonek2.free.fr/UNIX/48_R/13.html


1
cette question a été posée plusieurs fois sur cette liste. Telle est la réponse courte. J'écris une réponse détaillée plus tard dans la journée.
suncoolsu

Merci pour votre réponse rapide. Je suis désolé de ne pas avoir trouvé les autres réponses, mais je ne connais pas assez la terminologie pour savoir comment poser la question.
Alex Brown

Je pense que nous apprenons tous ici. C'est bon!
suncoolsu

Réponses:


13

La principale différence entre la conception de parcelles divisées et d'autres conceptions telles que la conception complètement aléatoire et les variations des conceptions de blocs est la structure d'imbrication des sujets, c'est-à-dire lorsque les observations sont obtenues à partir du même sujet (unité expérimentale) plus d'une fois. Cela conduit à une structure de corrélation au sein d'un sujet dans la conception de parcelles divisées qui est différente de la structure de corrélation dans un bloc.

Prenons un exemple d'image d'un ensemble de données à partir d'une conception de parcelle fractionnée simple (ci-dessous). Il s'agit d'une étude de la composition alimentaire sur la santé, quatre régimes ont été assignés au hasard à 12 sujets, tous ayant un état de santé similaire. La tension artérielle de base a été établie, et une mesure de la santé était la variation de la pression artérielle après deux semaines. La pression artérielle a été mesurée le matin et le soir. (L'exemple est copié de l' exemple 5.1 du livre de conception statistique de Casella )

 Diet1Diet2Diet3Diet4 SubjectSubjectSubjectSubject 123456789101112MorningxxxxxxxxxxxxEveningxxxxxxxxxxxx

Quelques points importants à noter:

  • Il y a 12 unités expérimentales (12 sujets)
  • Sur ces 12 unités, nous observons 24 points de données ( ), notés2×4×3x
  • En effet, nous faisons deux observations sur le même sujet, la première le matin et la seconde le soir
  • Cela signifie que les deux observations sur un sujet proviennent de la même unité expérimentale. Par conséquent, la réplication n'est pas vraie. Parce que les observations sont prises sur le même sujet au cours du temps, il doit y avoir une certaine corrélation entre les deux observations.
  • Notez que ceci est différent d'une ANOVA bidirectionnelle avec le régime et le temps comme facteurs.
  • Une ANOVA bidirectionnelle aura des observations comme celle-ci:

 Diet1Diet2Diet3Diet4MorningxxxxxxxxxxxxEveningxxxxxxxxxxxx

chacun des est ici un sujet différent. Cela illustre le concept d'imbrication. Autrement dit, les sujets 1, 2, 3 sont imbriqués dans le régime 1. - Les parcelles entières, les unités expérimentales au niveau de la parcelle entière (régime) (les sujets) agissent comme des blocs pour le traitement de la parcelle divisée (matin-soir)x

Le modèle pour cette conception de parcelle fractionnée est:

Yijk=μ+τi+Sij+γk+(τγ)ik+ϵijk,
où Une fois le modèle bien formulé, l'écriture sous forme est triviale:
Yijk=the response to diet i of subject j at time k,
τi=diet i effect
Sij=subject j's effect in diet i (whole plot error)
(τγ)ik=the interaction of diet i and time j
ϵijk=split plot error
R aov
splitPltMdl <- aov(bloodPressure ~ Diet + ## Diet effect 
                                   Error(Subject/Diet) + ## nesting of Subject in Diet 
                                   Time*Diet, ## interaction of Time and Diet 
                                   data = dietData)

1
+1 belle réponse. Si vous pouviez maintenant m'expliquer comment vous effectuez des tests post-hoc ou des comparaisons prévues (par exemple, y a-t-il une différence entre le matin et le soir dans les groupes 1 et 2, regroupés), vous me répondriez à beaucoup de questions. Voir aussi ma question sur R-help: article.gmane.org/gmane.comp.lang.r.general/237681
Henrik

Je suis un peu occupé en ce moment. Je reviendrai certainement à vous.
suncoolsu

@suncoolsu: ... livrera sûrement?
russellpierce

Pourquoi n'incluez-vous pas l'effet Temps dans votre formule de modèle? Pourquoi incluez-vous Dietet Time*Dietdans l' aovappel? Cela devrait Time:Dietcorrespondre à votre formule mathématique.
amoeba
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.