Voici un tableau étonnamment vaste des index de copie des réponses, avec peu de discussion sur leurs mérites: http://www.bjournal.co.uk/paper/BJASS_01_01_06.pdf .
Il existe un domaine de la psychologie (éducative) appelé théorie de la réponse aux items (IRT) qui fournit le contexte statistique pour des questions comme celles-ci. Si vous êtes un Américain et avez passé un SAT, ACT ou GRE, vous avez traité un test développé en pensant à l'IRT. Le postulat de base de l'IRT est que chaque étudiant est caractérisé par sa capacité ; chaque question est caractérisée par sa difficulté ; et la probabilité de répondre correctement à une question est
où est le cdf de la normale standard, etjeunejebj
π(uneje,bj; c ) = P r o b [l' élève i répond correctement à la question j ] = Φ ( c (uneje-bj) )
Φ ( z)cest un paramètre de sensibilité / discrimination supplémentaire (parfois, il est rendu spécifique à la question, , s'il y a suffisamment d'informations, c'est-à-dire suffisamment de candidats pour identifier les différences). Une hypothèse cachée ici, étant donné la capacité des élèves , les réponses aux différentes questions sont indépendantes. Cette hypothèse est violée si vous avez une batterie de questions sur le même paragraphe de texte, mais abstenons-en une minute.
cjje
Pour les questions "Oui / Non", cela peut être la fin de l'histoire. Pour plus de deux catégories de questions, nous pouvons faire l'hypothèse supplémentaire que tous les mauvais choix sont également probables; pour une question avec choix, la probabilité de chaque mauvais choix est .jkjπ′(uneje,bj; c ) = [ 1 - π(uneje,bj; c ) ] / (kj- 1 )
Pour les étudiants de capacités uneje et unek, la probabilité qu'ils correspondent à leurs réponses pour une question avec difficulté bj est
ψ (uneje,unek;bj, c ) = π(uneje,bj; c ) π(unek,bj; c ) + ( k - 1 )π′(uneje,bj; c )π′(unek,bj; c )
Si vous le souhaitez, vous pouvez diviser cela en probabilité de correspondance sur la bonne réponse,
ψc(uneje,unek;bj, c ) = π(uneje,bj; c ) π(unek,bj; c ), et la probabilité d'appariement sur une réponse incorrecte,
ψje(uneje,unek;bj, c ) = ( k - 1 )π′(uneje,bj; c )π′(unek,bj; c ), bien que tirée du cadre conceptuel de l'IRT, cette distinction n'est guère matérielle.
Maintenant, vous pouvez calculer la probabilité d'appariement, mais elle sera probablement minuscule combinatoire. Une meilleure mesure peut être le rapport des informations dans le modèle de réponses par paire,
je( i , k ) =∑j1 {rencontrej} lnψ (uneje,unek;bj, c ) + 1 {non-matchj} ln[ 1 - ψ (uneje,unek;bj, c ) ]
et le relier à l'entropie
E( i , k ) = E [ I( i , k ) ] =∑jψ (uneje,unek;bj, c ) lnψ (uneje,unek;bj, c ) + ( 1 - ψ (uneje,unek;bj, c ) ) ln[ 1 - ψ (uneje,unek;bj, c ) ]
Vous pouvez le faire pour toutes les paires d'élèves, les tracer ou les classer et rechercher les plus grands rapports d'informations sur l'entropie.
Les paramètres du test { c ,bj, j = 1 , 2 , … } et les capacités des élèves {uneje}ne tombera pas du ciel bleu, mais ils sont facilement estimables dans les logiciels modernes tels que R avec
lme4
ou des packages similaires:
irt <- glmer( answer ~ 1 + (1|student) + (1|question), family = binomial)
ou quelque chose de très proche de cela.