L'idée de l'analyse adaptative des données est que vous modifiez votre plan d'analyse des données à mesure que vous en apprenez davantage. Dans le cas de l'analyse exploratoire des données (EDA), c'est généralement une bonne idée (vous recherchez souvent des tendances imprévues dans les données), mais pour une étude de confirmation, cela est largement accepté comme une méthode d'analyse très imparfaite (à moins que tous les étapes sont clairement définies et correctement planifiées à l'avance).
Cela étant dit, l'analyse adaptative des données est généralement le nombre de chercheurs qui effectuent réellement leurs analyses, au grand désarroi des statisticiens. En tant que tel, si l'on pouvait le faire d'une manière statistiquement valable, cela révolutionnerait la pratique statistique.
L' article suivant de Science prétend avoir trouvé une méthode pour le faire (je m'excuse pour le paywall, mais si vous êtes dans une université, vous avez probablement accès): Dwork et al, 2015, The réutilisable holdout: Preserving valid in adaptive data analysis .
Personnellement, j'ai toujours été sceptique sur les articles de statistiques publiés dans Science , et celui-ci n'est pas différent. En fait, après avoir lu l'article deux fois, y compris le matériel supplémentaire, je ne comprends pas (du tout) pourquoi les auteurs affirment que leur méthode empêche le sur-ajustement.
D'après ce que je comprends, ils ont un ensemble de données d'exclusion qu'ils vont réutiliser. Ils semblent prétendre qu'en "fuzzing" la sortie de l'analyse de confirmation sur l'ensemble de données de holdout, le sur-ajustement sera évité (il convient de noter que le fuzzing semble simplement ajouter du bruit si la statistique calculée sur les données d'entraînement est suffisamment éloignée à partir de la statistique calculée sur les données d'exclusion ). Pour autant que je sache, il n'y a pas de raison réelle que cela empêche le sur-ajustement.
Suis-je dans l'erreur sur ce que proposent les auteurs? Y a-t-il un effet subtil que je néglige? Ou la science a-t-elle approuvé la pire pratique statistique à ce jour?