Ce ne sera pas tant une réponse qu'un commentaire.
La qualité dépend de plusieurs choses, y compris (comme Aaron l'a dit ci-dessus) 1) la paire de langues et 2) le sujet, mais aussi 3) les genres et 4) le style de l'original, et 5) la quantité de texte parallèle que vous avez pour former le système MT.
Pour préparer le terrain, pratiquement tous les MT de nos jours sont basés sur des textes parallèles, c'est-à-dire un texte dans deux langues différentes, l'une étant vraisemblablement une traduction de l'autre (ou les deux étant une traduction d'une troisième langue); et potentiellement utiliser des dictionnaires (peut-être assistés par des processus morphologiques) comme backoff lorsque les textes parallèles ne contiennent pas de mots particuliers.
De plus, comme d'autres l'ont dit, un système de MT ne comprend aucunement les textes qu'il traduit; il ne voit que des chaînes de caractères et des séquences de mots composés de caractères, et il recherche des chaînes et des séquences similaires dans les textes qu'il a traduits auparavant. (Ok, c'est un peu plus compliqué que ça, et il y a eu des tentatives pour arriver à la sémantique dans les systèmes informatiques, mais pour l'instant ce sont surtout des chaînes.)
1) Les langues varient. Certaines langues ont beaucoup de morphologie, ce qui signifie qu'elles font des choses avec un seul mot que d'autres langues font avec plusieurs mots. Un exemple simple serait l'espagnol 'cantaremos' = anglais "nous allons chanter". Et une langue peut faire des choses que l'autre langue ne dérange même pas, comme la distinction informelle / formelle (tu / usted) en espagnol, à laquelle l'anglais n'a pas d'équivalent. Ou une langue peut faire des choses avec la morphologie qu'une autre langue fait avec l'ordre des mots. Ou le script que la langue utilise peut même ne pas marquer les limites des mots (chinois et quelques autres). Plus les deux langues sont différentes, plus il sera difficile pour le système MT de traduire entre elles. Les premières expériences en MT statistique ont été faites entre le français et l'anglais,
2) Sujet: Si vous avez des textes parallèles dans la Bible (ce qui est vrai pour presque toutes les paires de langues écrites), et que vous en entraînez votre système de MT, ne vous attendez pas à ce qu'il fasse bien sur les textes d'ingénierie. (Eh bien, la Bible est une quantité relativement petite de texte par rapport aux normes de formation des systèmes de MT de toute façon, mais faites semblant :-).) Le vocabulaire de la Bible est très différent de celui des textes d'ingénierie, tout comme la fréquence de divers grammaticaux constructions. (La grammaire est essentiellement la même, mais en anglais, par exemple, vous obtenez beaucoup plus de voix passive et plus de noms composés dans les textes scientifiques et techniques.)
3) Genera: Si votre texte parallèle est tout déclaratif (comme les manuels du tracteur, par exemple), essayer d'utiliser le système MT résultant dans la boîte de dialogue ne vous donnera pas de bons résultats.
4) Style: Pensez Hilary vs Donald; érudit contre populaire. S'entraîner sur l'un n'obtiendra pas de bons résultats sur l'autre. De même, la formation du système MT sur les romans pour adultes et son utilisation dans les livres pour enfants.
5) Paire de langues: l'anglais a beaucoup de textes et les chances de trouver des textes dans une autre langue qui sont parallèles à un texte anglais donné sont beaucoup plus élevées que les chances de trouver des textes parallèles, disons en russe et en igbo. (Cela dit, il peut y avoir des exceptions, comme les langues de l'Inde.) En général, plus vous avez de textes parallèles pour former le système MT, meilleurs sont les résultats.
En somme, la langue est compliquée (c'est pourquoi je l'aime - je suis linguiste). Il n'est donc pas surprenant que les systèmes MT ne fonctionnent pas toujours bien.
BTW, les traducteurs humains ne font pas toujours aussi bien non plus. Il y a une décennie ou deux, je faisais traduire des documents de traducteurs humains en anglais, pour être utilisés comme matériel de formation pour les systèmes MT. Certaines traductions étaient difficiles à comprendre, et dans certains cas, lorsque nous avons obtenu des traductions de deux (ou plusieurs) traducteurs humains, il était difficile de croire que les traducteurs avaient lu les mêmes documents.
Et enfin, il n'y a (presque) jamais une seule traduction correcte; il existe plusieurs façons de traduire un passage, qui peuvent être plus ou moins bonnes, selon les fonctionnalités (correction grammaticale, style, cohérence d'utilisation, ...) que vous souhaitez. Il n'y a pas de mesure facile de la «précision».