Disons que j'ai un ensemble de 5 marqueurs. J'essaie de trouver les distances relatives entre chaque marqueur en utilisant un cadre de réalité augmentée tel que ARToolkit . Dans mon appareil photo, les 20 premières images ne me montrent que les 2 premiers marqueurs afin que je puisse déterminer la transformation entre les 2 marqueurs. Les 20 secondes images ne me montrent que les 2e et 3e marqueurs et ainsi de suite. Les 20 dernières images me montrent les 5ème et 1er marqueurs. Je veux construire une carte 3D des positions des marqueurs des 5 marqueurs.
Ma question est, sachant qu'il y aura des inexactitudes avec les distances en raison de la faible qualité du flux vidéo, comment puis-je minimiser les inexactitudes compte tenu de toutes les informations que j'ai recueillies?
Mon approche naïve serait d'utiliser le premier marqueur comme point de base, à partir des 20 premières images prendre la moyenne des transformations et placer le 2ème marqueur et ainsi de suite pour les 3ème et 4ème. Pour le 5ème marqueur, placez-le entre le 4ème et le 1er en le plaçant au milieu de la moyenne des transformations entre le 5ème et le 1er et le 4ème et le 5ème. Cette approche, je pense, a un biais vers le premier placement des marqueurs et ne prend pas en compte que la caméra voit plus de 2 marqueurs par image.
En fin de compte, je veux que mon système puisse déterminer la carte de x nombre de marqueurs. Dans une image donnée, jusqu'à x marqueurs peuvent apparaître et il y a des erreurs non systémiques dues à la qualité de l'image.
Toute aide concernant l'approche correcte de ce problème serait grandement appréciée.