Mesurer avec précision la distance relative entre un ensemble de repères (application de réalité augmentée)

Disons que j'ai un ensemble de 5 marqueurs. J'essaie de trouver les distances relatives entre chaque marqueur en utilisant un cadre de réalité augmentée tel que ARToolkit . Dans mon appareil photo, les 20 premières images ne me montrent que les 2 premiers marqueurs afin que je puisse déterminer la transformation entre les 2 marqueurs. Les 20 secondes images ne me montrent que les 2e et 3e marqueurs et ainsi de suite. Les 20 dernières images me montrent les 5ème et 1er marqueurs. Je veux construire une carte 3D des positions des marqueurs des 5 marqueurs.

Ma question est, sachant qu'il y aura des inexactitudes avec les distances en raison de la faible qualité du flux vidéo, comment puis-je minimiser les inexactitudes compte tenu de toutes les informations que j'ai recueillies?

Mon approche naïve serait d'utiliser le premier marqueur comme point de base, à partir des 20 premières images prendre la moyenne des transformations et placer le 2ème marqueur et ainsi de suite pour les 3ème et 4ème. Pour le 5ème marqueur, placez-le entre le 4ème et le 1er en le plaçant au milieu de la moyenne des transformations entre le 5ème et le 1er et le 4ème et le 5ème. Cette approche, je pense, a un biais vers le premier placement des marqueurs et ne prend pas en compte que la caméra voit plus de 2 marqueurs par image.

En fin de compte, je veux que mon système puisse déterminer la carte de x nombre de marqueurs. Dans une image donnée, jusqu'à x marqueurs peuvent apparaître et il y a des erreurs non systémiques dues à la qualité de l'image.

Toute aide concernant l'approche correcte de ce problème serait grandement appréciée.

computer-vision augmented-reality

— Jkh2
source

1. La géométrie / disposition des marqueurs est-elle connue? 2. Pouvez-vous estimer la matrice fondamentale de la caméra grâce à une configuration d'étalonnage?

— nav

Vous pouvez utiliser la structure d'un algorithme de type mouvement pour estimer la pose de la caméra à partir de l'environnement, et non à partir des marqueurs, puis fusionner cette pose de caméra avec les poses de marqueur afin de détecter avec précision les emplacements des marqueurs. Connaissant la pose extrinsèque de votre caméra (par SFM), vous pouvez trianguler toutes les positions 3D.

Pour l'estimation de la pose, les méthodes à 5 points sont généralement plus précises que l'algorithme à 8 points.

Vraisemblablement, vous devriez procéder à un ajustement supplémentaire de l'ensemble afin que la précision globale augmente.

— Tolga Birdal
source