Un prédicteur Naive Bayes fait ses prédictions en utilisant cette formule:
où est un facteur de normalisation. Cela nécessite d'estimer les paramètres partir des données. Si nous faisons cela avec lissage, alors nous obtenons l'estimationP ( X i = x i | Y = y ) k
où il y a valeurs possibles pour X_i . Je suis d'accord avec ça. Cependant, pour le prieur, nous avonsX i
où il y a exemples dans l'ensemble de données. Pourquoi ne lissons-nous pas aussi le prieur? Ou plutôt, lissons- nous le prieur? Si oui, quel paramètre de lissage choisissons-nous? Il semble un peu idiot de choisir également , car nous faisons un calcul différent. Y a-t-il un consensus? Ou cela n'a-t-il pas trop d'importance?