C'est un fait bien connu que «la corrélation n'est pas égale à la causalité», mais l'apprentissage automatique semble être presque entièrement basé sur la corrélation. Je travaille sur un système pour estimer les performances des étudiants sur des questions basées sur leurs performances passées. Contrairement à d'autres tâches, comme la recherche Google, cela ne semble pas être le type de système qui peut être facilement joué - la causalité n'est donc pas vraiment pertinente à cet égard.
De toute évidence, si nous voulons faire des expériences pour optimiser le système, nous devrons nous soucier de la distinction corrélation / causalité. Mais, du point de vue de la simple construction d'un système pour sélectionner les questions susceptibles d'être du niveau de difficulté approprié, cette distinction a-t-elle une importance?