Un réseau de neurones unique peut-il gérer la reconnaissance de deux types d'objets, ou doit-il être divisé en deux réseaux plus petits?


9

En particulier, un ordinateur intégré (avec des ressources limitées) analyse le flux vidéo en direct d'une caméra de circulation, essayant de choisir de bonnes images qui contiennent les numéros de plaque d'immatriculation des voitures qui passent. Une fois la plaque localisée, le cadre est remis à une bibliothèque OCR pour extraire l'enregistrement et l'utiliser à nouveau.

Dans mon pays, deux types de plaques d'immatriculation sont couramment utilisés - rectangulaire (le typique) et carré - en fait, quelque peu rectangulaire mais "plus haut que plus large", avec l'enregistrement divisé sur deux rangées.

(Il existe d'autres types, mais ne les considérons pas; ils représentent un petit pourcentage et appartiennent généralement à des véhicules qui ne nous intéressent pas.)

En raison des ressources limitées et du besoin d'un traitement rapide en temps réel, la taille maximale du réseau (nombre de cellules et de connexions) que le système peut gérer est fixe.

Serait-il préférable de diviser cela en deux réseaux plus petits, chacun reconnaissant un type de plaques d'immatriculation, ou le plus grand réseau unique traitera-t-il mieux les deux types?

Réponses:


6

Eh bien, je ne sais pas quel type de fonctionnalités vous donnez à votre réseau neuronal. Cependant, en général, j'irais avec un seul réseau de neurones. Il semble que vous n'ayez aucune limitation de ressources pour la formation de votre réseau et le seul problème concerne les ressources lorsque vous appliquez votre réseau.

Le fait est que les deux problèmes ont probablement des points communs (par exemple, les deux types de plaques sont rectangulaires). Cela signifie que si vous utilisez deux réseaux, chacun doit à nouveau résoudre le même sous-problème (la partie commune). Si vous utilisez un seul réseau, la partie commune du problème nécessite moins de cellules / poids à résoudre et les poids / cellules restants peuvent être utilisés pour une meilleure reconnaissance.

En fin de compte, si j'étais à votre place, j'essaierais les deux. Je pense que c'est la seule façon d'être vraiment sûr de la meilleure solution. En parlant théoriquement, il est possible que nous n'incluions pas certains facteurs.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.