Réponses:
Une très bonne ressource est la FAQ du réseau neuronal . La question dépend beaucoup de votre problème. Si le problème est de nature linéaire, il n'y a aucune raison d'avoir des couches cachées. Si le problème n'est pas linéaire, souvent une seule couche cachée avec environ 10 neurones cachés fera l'affaire.
Il y a une question très similaire (avec une réponse très similaire) à CrossValidated: Comment choisir le nombre de couches et de nœuds cachés dans un réseau neuronal à action directe? )