La chose la plus étrange que j'ai découverte en lisant la théorie du chaos afin de répondre à cette question était une pénurie étonnante de recherches publiées dans lesquelles l'exploration de données et ses proches exploitent la théorie du chaos. Ceci malgré un effort concerté pour les trouver, en consultant des sources telles que la théorie appliquée du chaos d'AB Ҫambel: un paradigme pour la complexité et Alligood, et le chaos: une introduction aux systèmes dynamiques (ce dernier est incroyablement utile comme livre de référence pour ce sujet) et piller leurs bibliographies. Après tout cela, je devais seulement proposer une seule étude qui pourrait être admissible et j'ai dû repousser les limites du «data mining» juste pour inclure ce cas de pointe: une équipe de l'Université du Texas effectuant des recherches sur les réactions de Belousov-Zhabotinsky (BZ) (qui étaient déjà sujettes à l'apériodicité) a découvert accidentellement des écarts dans l'acide malonique utilisé dans leurs expériences en raison de schémas chaotiques, les incitant à chercher un nouveau fournisseur. [1] Il y en a probablement d'autres - je ne suis pas un spécialiste de la théorie du chaos et je peux difficilement donner une évaluation exhaustive de la littérature - mais la disproportion flagrante avec des utilisations scientifiques ordinaires comme le problème des trois corps de la physique ne changerait pas beaucoup si nous les énumérions toutes. En fait, dans l'intervalle, lorsque cette question a été close, J'ai envisagé de le réécrire sous le titre «Pourquoi y a-t-il si peu d'implémentations de la théorie du chaos dans l'exploration de données et les domaines connexes?» Ceci est incompatible avec le sentiment mal défini mais largement répandu qu'il devrait y avoir une multitude d'applications dans l'exploration de données et les domaines connexes, comme les réseaux neuronaux, la reconnaissance de formes, la gestion de l'incertitude, les ensembles flous, etc.; après tout, la théorie du chaos est également un sujet de pointe avec de nombreuses applications utiles. J'ai dû réfléchir longuement et exactement où se situaient les frontières entre ces domaines afin de comprendre pourquoi ma recherche était vaine et mon impression fausse.
The; tldr Répondre
La courte explication de ce déséquilibre flagrant dans le nombre d'études et l'écart par rapport aux attentes peut être attribuée au fait que la théorie du chaos et l'exploration de données, etc. répondent à deux classes de questions soigneusement séparées; la dichotomie nette entre eux est évidente une fois signalée, mais si fondamentale qu'elle passe inaperçue, un peu comme regarder son propre nez. Il pourrait y avoir une certaine justification pour la croyance que la nouveauté relative de la théorie du chaos et des domaines comme l'exploration de données explique une partie du manque d'implémentations, mais nous pouvons nous attendre à ce que le déséquilibre relatif persiste même au fur et à mesure que ces champs mûrissent parce qu'ils abordent simplement des aspects distinctement différents de la même pièce. Presque toutes les implémentations à ce jour ont été dans des études de fonctions connues avec des sorties bien définies qui se sont avérées justement présenter quelques aberrations chaotiques déroutantes, tandis que l'exploration de données et les techniques individuelles comme les réseaux de neurones et les arbres de décision impliquent toutes la détermination d'une fonction inconnue ou mal définie. Des domaines connexes tels que la reconnaissance de formes et les ensembles flous peuvent également être considérés comme l'organisation des résultats de fonctions qui sont également souvent inconnues ou mal définies, lorsque les moyens de cette organisation ne sont pas non plus facilement apparents. Cela crée un gouffre pratiquement insurmontable qui ne peut être franchi que dans certaines circonstances rares - mais même ceux-ci peuvent être regroupés sous la rubrique d'un cas d'utilisation unique: empêcher les interférences apériodiques avec les algorithmes d'exploration de données. Des domaines connexes tels que la reconnaissance de formes et les ensembles flous peuvent également être considérés comme l'organisation des résultats de fonctions qui sont également souvent inconnues ou mal définies, lorsque les moyens de cette organisation ne sont pas non plus facilement apparents. Cela crée un gouffre pratiquement insurmontable qui ne peut être franchi que dans certaines circonstances rares - mais même ceux-ci peuvent être regroupés sous la rubrique d'un cas d'utilisation unique: empêcher les interférences apériodiques avec les algorithmes d'exploration de données. Des domaines connexes tels que la reconnaissance de formes et les ensembles flous peuvent également être considérés comme l'organisation des résultats de fonctions qui sont également souvent inconnues ou mal définies, lorsque les moyens de cette organisation ne sont pas non plus facilement apparents. Cela crée un gouffre pratiquement insurmontable qui ne peut être franchi que dans certaines circonstances rares - mais même ceux-ci peuvent être regroupés sous la rubrique d'un cas d'utilisation unique: empêcher les interférences apériodiques avec les algorithmes d'exploration de données.
Incompatibilité avec le flux de travail Chaos Science
Le flux de travail typique dans la «science du chaos» consiste à effectuer une analyse informatique des sorties d'une fonction connue, souvent à côté d'aides visuelles de l'espace des phases, comme les diagrammes de bifurcation, les cartes Hénon, les sections de Poincaré, les diagrammes de phase et les trajectoires de phase. Le fait que les chercheurs s'appuient sur l'expérimentation informatique illustre à quel point les effets chaotiques sont difficiles à trouver; ce n'est pas quelque chose que vous pouvez habituellement déterminer avec un stylo et du papier. Ils se produisent également exclusivement dans les fonctions non linéaires. Ce flux de travail n'est possible que si nous avons une fonction connue avec laquelle travailler. L'exploration de données peut produire des équations de régression, des fonctions floues et similaires, mais elles partagent toutes la même limitation: ce ne sont que des approximations générales, avec une fenêtre d'erreur beaucoup plus large. En revanche, les fonctions connues sujettes au chaos sont relativement rares, tout comme les plages d'entrées qui produisent des modèles chaotiques, un haut degré de spécificité est donc nécessaire même pour tester les effets chaotiques. Tout attracteur étrange présent dans l'espace des phases de fonctions inconnues se déplacerait ou disparaîtrait certainement à mesure que leurs définitions et leurs entrées changent, ce qui complique grandement les procédures de détection décrites par des auteurs comme Alligood, et al.
Le chaos en tant que contaminant dans les résultats de l'exploration de données
En fait, la relation de l'exploration de données et de ses apparentés à la théorie du chaos est pratiquement contradictoire. Cela est littéralement vrai si nous considérons la cryptanalyse de manière générale comme une forme spécifique d'exploration de données, étant donné que j'ai parcouru au moins un document de recherche sur l'exploitation du chaos dans les schémas de cryptage (je ne trouve pas la citation pour le moment, mais je peux chasser vers le bas sur demande). Pour un mineur de données, la présence de chaos est normalement une mauvaise chose, car les plages de valeurs apparemment absurdes qu'il génère peuvent compliquer considérablement le processus déjà ardu d'approximation d'une fonction inconnue. L'utilisation la plus courante du chaos dans l'exploration de données et les domaines connexes est de l'exclure, ce qui n'est pas une mince affaire. Si des effets chaotiques sont présents mais non détectés, leurs effets sur une entreprise d'exploration de données peuvent être difficiles à surmonter. Pensez simplement à la facilité avec laquelle un réseau neuronal ordinaire ou un arbre de décision pourrait surpasser les sorties apparemment absurdes d'un attracteur chaotique, ou comment des pointes soudaines dans les valeurs d'entrée pourraient certainement confondre l'analyse de régression et pourraient être attribuées à de mauvais échantillons ou à d'autres sources d'erreur. La rareté des effets chaotiques parmi toutes les fonctions et gammes d'entrée signifie que leur investigation serait gravement priorisée par les expérimentateurs.
Méthodes de détection du chaos dans les résultats de l'exploration de données
Certaines mesures associées à la théorie du chaos sont utiles pour identifier les effets apériodiques, comme l'entropie de Kolmogorov et l'exigence que l'espace de phase présente un exposant de Lyapunov positif. Ces deux éléments figurent sur la liste de contrôle pour la détection du chaos [2] fournie dans la théorie appliquée du chaos d'AB Ҫambel, mais la plupart ne sont pas utiles pour les fonctions approximatives, telles que l'exposant de Lyapunov, qui nécessite des fonctions définies avec des limites connues. La procédure générale qu'il décrit pourrait néanmoins être utile dans les situations d'exploration de données; L'objectif de elambel est finalement un programme de «contrôle du chaos», c'est-à-dire l'élimination des effets apériodiques interférents. [3] D'autres méthodes comme le calcul des dimensions de comptage de boîtes et de corrélation pour détecter les dimensions fractionnaires qui conduisent au chaos pourraient être plus pratiques dans les applications d'exploration de données que Lyapunov et d'autres sur sa liste. Un autre signe révélateur d'effets chaotiques est la présence de modèles de doublement de période (ou triplement et au-delà) dans les sorties de fonction, qui précède souvent le comportement apériodique (c'est-à-dire «chaotique») dans les diagrammes de phase.
Différencier les applications tangentielles
Ce cas d'utilisation principal doit être différencié d'une classe distincte d'applications qui ne sont que tangentiellement liées à la théorie du chaos. En y regardant de plus près, la liste des «applications potentielles» que j'ai fournie dans ma question consistait en fait presque entièrement en des idées pour tirer parti des concepts dont dépend la théorie du chaos, mais qui peuvent être appliqués indépendamment en l'absence de comportement apériodique (sauf le doublement de la période). J'ai récemment pensé à une nouvelle utilisation de niche potentielle, générant un comportement apériodique pour faire sortir les réseaux neuronaux des minima locaux, mais cela aussi ferait partie de la liste des applications tangentielles. Beaucoup d'entre eux ont été découverts ou étoffés à la suite de recherches sur la science du chaos, mais peuvent être appliqués à d'autres domaines. Ces "applications tangentielles" n'ont que des connexions floues entre elles mais forment une classe distincte, séparé par une frontière dure du cas d'utilisation principal de la théorie du chaos dans l'exploration de données; le premier exploite certains aspects de la théorie du chaos sans les modèles apériodiques, tandis que le second est uniquement consacré à exclure le chaos comme facteur de complication dans les résultats de l'exploration de données, peut-être avec l'utilisation de conditions préalables comme la positivité de l'exposant de Lyapunov et la détection d'un doublement de période . Si nous faisons la différence entre la théorie du chaos et d'autres concepts qu'elle utilise correctement, il est facile de voir que les applications de la première sont intrinsèquement limitées aux fonctions connues dans les études scientifiques ordinaires. Il y a vraiment de bonnes raisons d'être enthousiasmé par les applications potentielles de ces concepts secondaires en l'absence de chaos, mais aussi une raison de s'inquiéter des effets contaminants d'un comportement apériodique inattendu sur les efforts d'exploration de données lorsqu'il est présent. De telles occasions seront rares, mais cette rareté signifie également qu'elles ne seront pas détectées. La méthode de elambel pourrait cependant être utile pour éviter de tels problèmes.
[1] pp. 143-147, Alligood, Kathleen T .; Sauer, Tim D. et Yorke, James A., 2010, Chaos: An Introduction to Dynamical Systems, Springer: New York. [2] pp. 208-213, Ҫambel, AB, 1993, Théorie appliquée du chaos: un paradigme pour la complexité, Academic Press, Inc.: Boston. [3] p. 215, Ҫambel.