Pour les modèles statistiques et d'apprentissage automatique, il existe plusieurs niveaux d'interprétabilité: 1) l'algorithme dans son ensemble, 2) des parties de l'algorithme en général 3) des parties de l'algorithme sur des entrées particulières, et ces trois niveaux divisés en deux parties chacun, un pour la formation et un pour la fonction eval. Les deux dernières parties sont beaucoup plus proches que la première. Je pose des questions sur le n ° 2, ce qui conduit généralement à une meilleure compréhension du n ° 3). (si ce n'est pas ce que signifie «interprétabilité», alors à quoi devrais-je penser?)
En ce qui concerne l'interprétabilité, la régression logistique est l'une des plus faciles à interpréter. Pourquoi cette instance a-t-elle dépassé le seuil? Parce que cet exemple avait cette caractéristique positive particulière et qu'il avait un coefficient plus élevé dans le modèle. C'est tellement évident!
Un réseau de neurones est l'exemple classique d'un modèle difficile à interpréter. Que signifient tous ces coefficients ? Ils s'additionnent tous de façon si compliquée et folle qu'il est difficile de dire ce que fait réellement un coefficient particulier.
Mais avec tous les réseaux neuronaux profonds qui sortent, on a l'impression que les choses deviennent plus claires. Les modèles DL (par exemple, la vision) semblent capturer des choses comme les bords ou l'orientation dans les premières couches, et dans les couches ultérieures, il semble que certains nœuds soient en fait sémantiques (comme la proverbiale `` cellule de grand-mère '' ). Par exemple:
( extrait de «Learning About Deep Learning» )
Il s'agit d'un graphique ( parmi tant d'autres ) créé à la main pour la présentation, je suis donc très sceptique. Mais c'est la preuve que quelqu'un pense que c'est ainsi que cela fonctionne.
Peut-être que dans le passé, il n'y avait tout simplement pas assez de couches pour que nous trouvions des fonctionnalités reconnaissables; les modèles ont été couronnés de succès, mais pas faciles à analyser en particulier après coup.
Mais peut-être que le graphique n'est qu'un vœu pieux. Peut-être que les NN sont vraiment insondables.
Mais les nombreux graphiques avec leurs nœuds étiquetés avec des images sont également vraiment convaincants.
Les nœuds DL correspondent-ils vraiment à des fonctionnalités?