J'ai posé une question similaire concernant la distance entre les "documents" (articles Wikipedia, actualités, etc.). J'ai fait de cette question une question distincte car les requêtes de recherche sont considérablement plus petites que les documents et sont considérablement plus bruyantes. Je ne sais donc pas (et je doute) si les mêmes mesures de distance seraient utilisées ici.
Soit les métriques de distance lexicale vanille, soit les métriques de distance sémantiques de pointe sont préférées, avec une préférence plus forte pour ces dernières.