New Adhockeries
Au cours des dernières années, l'habitude orthodoxe d'inventer des dispositifs intuitifs plutôt que de recourir à des principes théoriques connectés a été étendue à de nouveaux problèmes d'une manière qui donne à première vue l'impression que plusieurs nouveaux domaines scientifiques ont été créés. Pourtant, tous sont préoccupés par le raisonnement à partir d'informations incomplètes; et nous pensons que nous avons des théorèmes établissant que la théorie des probabilités comme logique est le moyen général de traiter tous ces problèmes. Nous notons trois exemples.
Les ensembles flous sont - de toute évidence, pour quiconque est formé à l'inférence bayésienne - des approximations grossières des probabilités antérieures bayésiennes. Ils ont été créés uniquement parce que leurs pratiquants persistaient à penser la probabilité en termes de "hasard" supposé exister dans la Nature mais jamais bien définis; et a donc conclu que la théorie des probabilités n'est pas applicable à de tels problèmes. Dès que l'on reconnaît la probabilité comme le moyen général de spécifier des informations incomplètes , la raison de l'introduction des ensembles flous disparaît.
De même, une grande partie de l'intelligence artificielle (IA) est une collection de dispositifs intuitifs pour raisonner à partir d'informations incomplètes qui, comme les plus anciennes des statistiques orthodoxes, sont des approximations des méthodes bayésiennes et utilisables dans une classe restreinte de problèmes; mais qui donnent des conclusions absurdes lorsque nous essayons de les appliquer à des problèmes extérieurs à cette classe. Encore une fois, ses praticiens ne sont pris dans cela que parce qu'ils continuent de penser que la probabilité représente un "hasard" physique au lieu d'informations incomplètes. Dans l'inférence bayésienne, tous ces résultats sont contenus automatiquement - et plutôt trivialement - sans aucune limitation à une classe restreinte de problèmes.
Le grand nouveau développement est Neural Nets, ce qui signifie un système d'algorithmes avec la merveilleuse nouvelle propriété qu'ils sont, comme le cerveau humain, adaptatifs afin qu'ils puissent apprendre des erreurs passées et se corriger automatiquement (WOW! Quelle excellente nouvelle idée!) . En effet, nous ne sommes pas surpris de voir que les réseaux neuronaux sont en fait très utiles dans de nombreuses applications; plus que les ensembles flous ou l'IA. Cependant, les réseaux neuronaux actuels ont deux défauts pratiques; (a) Ils produisent une sortie déterminée par la contribution actuelle plus les informations de formation passées. Cette sortie est vraiment une estimationde la réponse appropriée, sur la base de toutes les informations disponibles, mais elle ne donne aucune indication sur son exactitude, et donc elle ne nous dit pas à quel point nous sommes proches de l'objectif (c'est-à-dire, combien de formation supplémentaire est nécessaire); (b) Lorsqu'une réponse non linéaire est requise, on fait appel à une fonction non linéaire standard "sigmoïde" stockée en interne, qui avec diverses amplifications et mélanges linéaires peut être amenée à approximer, dans une certaine mesure, la véritable fonction non linéaire. (Remarque: c'est moi qui souligne.)
Mais faut-il vraiment souligner que (1) Toute procédure adaptative est, par définition, un moyen de prendre en compte des informations incomplètes; (2) Le théorème de Bayes est précisément la mère de toutes les procédures adaptatives; la règle générale de mise à jour de tout état des connaissances pour tenir compte des nouvelles informations; (3) Lorsque ces problèmes sont formulés en termes bayésiens, un seul calcul donne automatiquement à la fois la meilleure estimation et sa précision; (4) Si la non-linéarité est demandée, le théorème de Bayes génère automatiquement la fonction non linéaire exacte demandée par le problème, au lieu d'essayer de construire une approximation de celle-ci par un autre dispositif ad hoc .
En d'autres termes, nous soutenons qu'il ne s'agit pas du tout de nouveaux domaines; seuls les faux départs. Si l'on formule tous ces problèmes par la prescription bayésienne standard, on a automatiquement tous leurs résultats utiles sous une forme améliorée. Les difficultés que les gens semblent avoir à comprendre cela sont tous des exemples du même échec à conceptualiser la relation entre les mathématiques abstraites et le monde réel. Dès que nous reconnaissons que les probabilités ne décrivent pas la réalité - seulement nos informations sur la réalité - les portes sont grandes ouvertes à la solution optimale des problèmes de raisonnement à partir de ces informations.