Étant donné une énorme base de données de mots autorisés (triés par ordre alphabétique) et un mot, recherchez le mot de la base de données le plus proche du mot donné en termes de distance de Levenshtein.
L'approche naïve consiste, bien entendu, à simplement calculer la distance de levenshtein entre le mot donné et tous les mots du dictionnaire (on peut faire une recherche binaire dans la base de données avant de calculer réellement les distances).
Je me demande s'il existe une solution plus efficace à ce problème. Peut-être une heuristique qui nous permet de réduire le nombre de mots à rechercher, ou des optimisations à l'algorithme de distance levenshtein.
Liens vers des articles sur le sujet bienvenus.