Pouvez-vous répertorier des descripteurs d'entités invariants d'échelle et de rotation à utiliser dans la détection d'entités.
L'application est destinée à la détection de voitures et d'êtres humains en vidéo capturée par un drone, à l'aide d'un classificateur multi-classes.
Jusqu'à présent, j'ai regardé SIFT et MSER (qui est invariant affine). J'ai aussi regardé LESH, LESH est basé sur le modèle énergétique local, mais est calculé d'une manière qui n'est pas invariante en rotation, j'ai essayé de penser à un moyen d'utiliser l'énergie locale, de construire un invariant en rotation descripteur de fonctionnalité, je lis ici Quelles sont les alternatives gratuites à SIFT / SURF qui peuvent être utilisées dans des applications commerciales? , que "si vous attribuez une orientation au point d'intérêt et faites pivoter le patch d'image en conséquence, vous obtenez gratuitement l'invariance rotationnelle", mais je ne sais pas si cela est même apaisant ou comment je pourrais l'appliquer à mon problème, toute aide serait apprécié, merci