Si l'ordinateur était capable d'évaluer chaque ligne de jeu jusqu'à la fin de la partie, l'évaluation ne changerait jamais. En effet, l'évaluation de chaque coup serait soit "gagnant", "perdant" ou "nul". C'est essentiellement ce qui se passe dans les bases de table de fin de partie. * Si les ordinateurs pouvaient le faire pour chaque position, chaque match contre un ordinateur consisterait à ce que l'ordinateur démissionne sans faire de mouvement, vous offrant un match nul à la position initiale ou étant ennuyé que vous n'ayez pas démissionné ou accepté cette offre de tirage.
Cependant, les ordinateurs ne peuvent pas évaluer aussi loin car cela prendrait un temps incroyablement long, à la fois parce que les jeux peuvent être très longs (des centaines de coups, en principe) et parce qu'il y a beaucoup de possibilités à chaque coup. Les ordinateurs doivent donc prendre un certain nombre de raccourcis. Cela comprend essayer de comprendre rapidement quels sont les mouvements candidats les plus importants (prendre une pièce non protégée est probablement un grand mouvement; accrocher votre reine est probablement un mouvement horrible; ...) et également arrêter la recherche après plusieurs mouvements et utiliser des heuristiques au lieu de chercher plus pour essayer de déterminer si la position résultante semble bonne ou non.
Le problème est que ces raccourcis peuvent mal tourner. L'ordinateur peut décider que suspendre une pièce est mauvais alors qu'il s'agit en fait d'un sacrifice de génie. Il pourrait décider qu'une position s'est stabilisée alors qu'elle ne l'a pas vraiment été. Il pourrait simplement ne pas avoir suffisamment de puissance pour voir suffisamment loin dans l'avenir pour voir le véritable point d'un mouvement particulier.
Voici un exemple simple, bien qu'il ne soit plus très réaliste. Supposons que vous êtes sur le point de me mater, mais j'ai une série de dix chèques que je peux faire pour vous retarder. Si je regarde seulement dix coups à l'avance, je pense que je vais bien: peut-être que je suis même un pion, donc mon évaluation est "Après dix coups, je suis toujours un pion, donc je suis bon Score +1 "Je joue mon premier chèque, tu réponds, et maintenant je vois que c'est mate sur dix et démissionne. C'est ce que l'on appelle «l'effet d'horizon» que les programmes modernes tentent d'éviter (par exemple, en regardant plus profondément le long de lignes qui ont beaucoup de mouvements forcés), mais il illustre le principe général.
Si le moteur peut voir, disons, dix coups dans le futur, alors il voit plus loin dans le jeu à chaque mouvement. À la position initiale, il peut voir à quoi ressemblera la planche au coup 10; après un mouvement, il peut voir se déplacer 11 et ainsi de suite. (Encore une fois, c'est une simplification, car les ordinateurs ne regardent pas aujourd'hui à une distance fixe dans le futur, mais cela vous donne une idée générale.)
L'exemple que vous avez donné n'est qu'une version moins dramatique des exemples que j'ai donnés. Au fur et à mesure que plus de mouvements sont effectués, l'ordinateur peut voir plus profondément dans le jeu, il peut donc donner une évaluation plus précise. Une autre façon de voir cela est en termes d'informations: à mesure que plus de coups sont joués, l'ordinateur a plus d'informations. Auparavant, vous deviniez quelle serait votre réponse à 1.e4, mais maintenant, vous savez que vous avez joué au Sicilien, etc.
* Il y a une légère nuance ici en ce que vous devez réellement compter le nombre de coups vers la victoire pour éviter de répéter les positions. Par exemple, considérez la phase finale de KQ vs K. Chaque mouvement qui ne stagne pas ou ne rend pas la reine gagne, donc vous avez besoin d'un mécanisme pour conduire vers échec et mat, plutôt que de simplement se déplacer au hasard et de dire: "Wow, je vais totalement pour gagner cela - presque chaque mouvement gagne! "