Une bonne approche de ce type de problème peut être trouvée dans la section 4 de l'article The Bayesian Image Retrieval System, PicHunter de Cox et al (2000). Les données sont un ensemble de résultats entiers où est le nombre d'essais. Dans votre cas, il y a 3 résultats possibles par essai. Je vais laisser l'index du visage qui a été laissé de côté. L'idée est de postuler un modèle génératif pour le résultat en fonction de certains paramètres du modèle, puis d'estimer les paramètres par maximum de vraisemblance. Si nous montrons des visages et que le participant dit que sont les plus similaires, alors le résultat est , avec probabilité
UNE1, . . . ,UNENNUNEje(X1,X2,X3)(X2,X3)A = 1
p ( A = 1 | X1,X2,X3) ∝ exp( - d(X2,X3) / σ)
où est la distance entre les faces 2 et 3, et est un paramètre pour la quantité de «bruit» (c'est-à-dire la cohérence des participants). Puisque vous voulez une intégration dans l'espace euclidien, votre mesure de distance serait:
où est le (inconnu ) encastrement de face . Les paramètres de ce modèle sont et , que vous pouvez estimer à partir des données via le maximum de vraisemblance. Le papier a utilisé une ascension en gradient pour trouver le maximum.
ré(X2,X3)σré( x , y) =∑k(θx k-θyk)2------------√
θXXθσ
Le modèle dans le papier était légèrement différent car le papier utilisait des attributs connus des images pour calculer la distance, plutôt qu'une incorporation inconnue. Pour apprendre une intégration, vous auriez besoin d'un ensemble de données beaucoup plus grand, dans lequel chaque face était affichée plusieurs fois.
Ce modèle de base suppose que tous les essais sont indépendants et que tous les participants sont identiques. Un bon avantage de cette approche est que vous pouvez facilement embellir le modèle pour inclure la non-indépendance, les effets des participants ou d'autres covariables.