Existe-t-il une littérature énumérant les caractéristiques des algorithmes qui permettent de les expliquer?
La seule littérature que je connaisse est le récent article de Ribero, Singh et Guestrin. Ils définissent d'abord l'explicabilité d'une seule prédiction:
Par «expliquer une prédiction», nous entendons présenter des artefacts textuels ou visuels qui fournissent une compréhension qualitative de la relation entre les composants de l'instance (par exemple, les mots dans le texte, les correctifs dans une image) et la prédiction du modèle.
Les auteurs expliquent plus en détail ce que cela signifie pour des exemples plus concrets, puis utilisent cette notion pour définir l'explicabilité d'un modèle. Leur objectif est d'essayer et, pour ainsi dire, d'ajouter artificiellement l'explicabilité à des modèles par ailleurs transparents, plutôt que de comparer l'explicabilité des méthodes existantes. Le document peut être utile de toute façon, car il tente d'introduire une terminologie plus précise autour de la notion d '«explicabilité».
Existe-t-il des modèles d'apprentissage automatique généralement reconnus comme représentant un bon compromis entre les deux?
Je suis d'accord avec @Winter que le filet élastique pour la régression (non seulement logistique) peut être considéré comme un exemple d'un bon compromis entre la précision de la prédiction et l'explicabilité.
Pour un autre type de domaine d'application (séries temporelles), une autre classe de méthodes fournit également un bon compromis: la modélisation bayésienne des séries chronologiques structurelles. Il hérite de l'explicabilité de la modélisation classique des séries chronologiques structurelles et d'une certaine flexibilité de l'approche bayésienne. Semblable à la régression logistique, l'explicabilité est facilitée par les équations de régression utilisées pour la modélisation. Voir cet article pour une belle application en marketing et d'autres références.
En ce qui concerne le contexte bayésien que nous venons de mentionner, vous voudrez peut-être également examiner les modèles graphiques probabilistes. Leur explicabilité ne repose pas sur des équations de régression, mais sur des moyens graphiques de modélisation; voir "Modèles graphiques probabilistes: principes et techniques" par Koller et Friedman pour un excellent aperçu.
Je ne sais pas si nous pouvons nous référer aux méthodes bayésiennes ci-dessus comme un "bon compromis généralement accepté". Ils peuvent ne pas être suffisamment connus pour cela, surtout par rapport à l'exemple du filet élastique.