La plupart des modèles avancés d'apprentissage en profondeur comme VGG, ResNet, etc. nécessitent des images carrées en entrée, généralement avec une taille de pixel de .
Y a-t-il une raison pour laquelle l'entrée doit être de forme égale, ou puis-je également créer un modèle convnet avec disons (si je veux faire la reconnaissance faciale par exemple et que j'ai des images de portrait)?
Y a-t-il un avantage accru avec une taille de pixel plus grande, disons ?