De la documentation de Lucene
Dans d'autres références (c'est-à-dire wikipedia ), l'IDF est généralement calculé comme ou pour éviter de plonger de 0.
Je me rends également compte que Lucene utilise plutôt que pour calculer TF, mais ma compréhension est que ce n'est qu'une transformation préférée, probablement pour éviter .
Quelqu'un peut-il expliquer ce +1 supplémentaire dans le terme de Tsahal?