Je suis récemment tombé sur Tesseract et OpenCV . Il semble que Tesseract est un moteur OCR à part entière et OpenCV peut être utilisé comme cadre pour créer une application / service OCR.
J'ai essayé d'utiliser Tesseract sur certaines de mes images et sa précision semble correcte. Plus tard, je suis tombé sur un tutoriel très simple sur l'utilisation d'OpenCV pour effectuer l'OCR en utilisant Python et j'ai été impressionné. En quelques minutes, j'ai terminé la formation du système et sa précision était bonne. Mais bien sûr, en adoptant cette approche, je dois entraîner mon système de manière approfondie à l'aide d'un grand ensemble de formation.
Mes questions spécifiques sont les suivantes:
- Comment choisir entre Tesseract et utiliser OpenCV pour créer une application OCR personnalisée?
- Il existe des ensembles de données de formation disponibles pour Tesseract pour différentes langues. OpenCV a-t-il quelque chose de similaire pour que je n'ai pas à recommencer pour réaliser l'OCR?
- Lequel est le meilleur pour une application commerciale qui veut être?
Aucune suggestion?