Vous pouvez citer le théorème du déjeuner gratuit si vous le souhaitez, mais vous pouvez également citer le Modus Ponens (également connu sous le nom de loi du détachement , la base du raisonnement déductif), qui est la racine du théorème du déjeuner gratuit .
Le Théorème No Free Lunch englobe une idée plus spécifique: le fait qu'il n'y a pas d'algorithme qui puisse convenir à toutes les fins. En d'autres termes, le théorème du déjeuner gratuit dit essentiellement qu'il n'y a pas de solution miracle algorithmique . Cela trouve son origine dans le Modus Ponens, car pour qu'un algorithme ou un test statistique donne le résultat correct, vous devez satisfaire les prémisses.
Comme dans tous les théorèmes mathématiques, si vous violez les prémisses, le test statistique est simplement vide de sens et vous ne pouvez en tirer aucune vérité. Donc, si vous voulez expliquer vos données à l'aide de votre test, vous devez supposer que les prémisses requises sont remplies, si elles ne le sont pas (et vous le savez), alors votre test est complètement faux.
En effet , le raisonnement scientifique est basée sur la déduction: essentiellement, votre test / droit / théorème est une règle d'implication , qui dit que si vous avez la Prémisse A
vous pouvez conclure B
: A=>B
, mais si vous n'avez pas A
, vous pouvez soit avoir B
ou non B
, et les deux cas sont vrais , c'est l'un des principes de base de l'inférence / déduction logique (la règle Modus Ponens). En d'autres termes, si vous violez les prémisses, le résultat n'a pas d'importance et vous ne pouvez rien en déduire .
Rappelez-vous le tableau binaire d'implication:
A B A=>B
F F T
F T T
T F F
T T T
Donc, dans votre cas, pour simplifier, vous avez Dependent_Variables => ANOVA_correct
. Maintenant, si vous utilisez des variables indépendantes, ce qui Dependent_Variables
est False
, l'implication sera vrai, puisque l' Dependent_Variables
hypothèse est violée.
Bien sûr, cela est simpliste, et dans la pratique, votre test ANOVA peut toujours renvoyer des résultats utiles car il y a presque toujours un certain degré d'indépendance entre les variables dépendantes, mais cela vous donne l'idée pourquoi vous ne pouvez pas simplement vous fier au test sans remplir les hypothèses .
Cependant, vous pouvez également utiliser des tests dont les prémisses ne sont pas satisfaites par l'original en réduisant votre problème: en relâchant explicitement la contrainte d'indépendance, votre résultat peut toujours être significatif, bien que non garanti (car alors vos résultats s'appliquent au problème réduit, pas au problème complet, vous ne pouvez donc pas traduire tous les résultats sauf si vous pouvez prouver que les contraintes supplémentaires du nouveau problème n'ont pas d'impact sur votre test et donc sur vos résultats).
Dans la pratique, cela est souvent utilisé pour modéliser des données pratiques, en utilisant par exemple Naive Bayes, en modélisant des variables dépendantes (au lieu d'indépendantes) en utilisant un modèle qui suppose des variables indépendantes et, étonnamment, cela fonctionne souvent très bien, et parfois mieux que les modèles comptables pour les dépendances . Vous pouvez également être intéressé par cette question sur la façon d'utiliser l'ANOVA lorsque les données ne répondent pas exactement à toutes les attentes .
Pour résumer: si vous avez l'intention de travailler sur des données pratiques et que votre objectif n'est pas de prouver un résultat scientifique mais de créer un système qui fonctionne simplement (c'est-à-dire un service Web ou toute autre application pratique), l'hypothèse d'indépendance (et peut-être d'autres hypothèses) peut être détendu, mais si vous essayez de déduire / prouver une vérité générale , alors vous devez toujours utiliser des tests que vous pouvez garantir mathématiquement (ou au moins en toute sécurité et de manière prouvable) que vous satisfaites à toutes les prémisses .