J'essaie de trouver une méthode pour détecter les personnes utilisant une seule caméra à 3 mètres du sol. Ceci est un cadre retourné par la caméra:
MISE À JOUR: Test vidéo -> http://dl.dropbox.com/u/5576334/top_head_shadow.avi
Pour ce faire, je comprends d'abord que je dois effectuer une segmentation arrière-plan au premier plan. C'est la partie facile.
Avec le masque de premier plan, je suis capable de faire des opérations simples telles que Hough transformer pour trouver des cercles, mais de cette façon, ne détecte que 60% des têtes, y compris de nombreux faux positifs.
Je pourrais utiliser d'autres techniques simples comme la segmentation des couleurs, mais j'ai trouvé que les têtes des gens sont très différentes vu d'en haut en raison de leur coiffure, couleur, quantité de cheveux, ...
Une autre option que j'ai à ce sujet est la possibilité d'utiliser des descripteurs HOG ou des fonctionnalités de type Haar, mais j'aurais besoin d'une base de données complète de personnes vues d'en haut pour former les modèles. Je n'ai rien trouvé de tel.
Je pensais que ce serait un problème très récurrent, mais je ne trouve pas grand-chose à ce sujet dans la littérature ou sur Internet. Toute aide pour résoudre cette tâche sera appréciée :-)
MISE À JOUR: Pour plus d'informations, l'objectif est de mettre en œuvre une méthode générique pour effectuer le suivi des flux piétons. Le premier prototype sera testé dans un centre commercial.