Y a-t-il une raison statistique pour laquelle la théorie de l'analyse / réponse des éléments n'est pas plus largement appliquée? Par exemple, si un enseignant donne un test à choix multiple de 25 questions et constate que 10 questions ont été répondues correctement par tout le monde, 10 questions ont été répondues par une fraction très faible (disons 10%) et les 5 autres ont été répondues par environ 50% des personnes. . N'est-il pas logique de repondérer les scores afin que les questions difficiles reçoivent plus de poids?
Et pourtant, dans le monde réel, les questions ont presque toujours la même pondération. Pourquoi?
Le lien ci-dessous discute des indices de discrimination et d'autres mesures des difficultés pour choisir quelles questions sont les meilleures: http://fcit.usf.edu/assessment/selected/responsec.html
Il semble cependant que la méthode de calcul de l'indice de discrimination des questions ne soit utilisée que de manière prospective (par exemple, si une question ne fait pas une bonne discrimination, jetez-la). Pourquoi les tests ne sont-ils pas repondérés pour la population actuelle?