quinta-feira, 25 de outubro de 2012

Qui a peur de la traduction automatique?


En dépit du nombre croissant de commentaires sur la menace que représente la traduction automatique, on constate des développements intéressants. En mai dernier, Google annonçait que son application API Google Translate [2]  (GT) jusqu'alors  gratuite, serait désormais payante. Au cours de l’été, je remarquai que les tout premiers adhérents enthousiastes à ce service de traduction entièrement automatisée étaient ….. des traducteurs indépendants professionnels.
Comment est-ce possible ? Il ne s’agit pourtant pas là d’amateurs, qui se contentent de consulter un dictionnaire, mais de professionnels sérieux, soucieux de qualité, qui ont investi dans des logiciels de TAO coûteux, [3] dans les ordinateurs appropriés pour les faire tourner et dans des services Internet haut de gamme. Les principaux fournisseurs de logiciels de TAO les ont poussés dans cette voie, en leur fournissant des plugiciels donnant accès aux services de traduction automatique en ligne, et pas seulement celui de Google mais aussi ceux de Microsoft, Yahoo et d’autres services concurrents. Pourtant, ces traducteurs sont prêts à payer pour le privilège de faire eux-mêmes de la post-éditique ?
Pour comprendre un tel paradoxe, et la raison de sa soudaine apparition, il est utile de faire quelques rappels de l’histoirerécente de la traduction automatique. Comme son nom l’indique, la traduction automatique (ou traduction machine) remonte aux tout débuts de l’ordinateur. Pendant des décennies, la TA ne concernait que les grands systèmes qu’utilisaient les laboratoires de recherche et les entreprises clientes importantes. La TA reposait sur les mots et les règles de combinaison de ces mots. C’était un service coûteux, presque aussi coûteux que les traducteurs humains. Puis survint le Web, et la TA était lâchée !
 On peut donner la date exacte de cet événement : décembre 1997. Alta Vista, alors le principal moteur de recherche, lançait une version d’essai (beta) de BabelFish sur son site Web. BabelFish reposait sur la technologie émanant de Systran, elle-même basée sur les règles traditionnelles. C’était gratuit et, en dépit de ses limites quant à la qualité, BabelFish connut un succès instantané, surtout quand il s’agissait de se faire une idée approximative (gisting) du contenu de sites Web en langues étrangères. C’était également une bonne source de mauvaises traductions assez drôles. 
La TA grand public était enfin arrivée ! Cela a pris cependant une autre décennie avant qu’une nouvelle approche se répande. Comme le raconte Steven Levy dans son histoire de Google [4], une sorte de biographie autorisée de l’entreprise, créée en 1998, les jeunes fondateurs de Google étaient eux-mêmes assez mécontents du service de traduction qu’ils offraient et qui reposait sur les mêmes règles de TA que BabelFish. Ils recherchaient une manière de traiter la traduction qui tire parti de leur réussite quant à la recherche. À cet effet, Google allait recruter Franz Och, un scientifique et chercheur universitaire en traduction automatique s’appuyant sur une méthode statistique, un domaine alors très expérimental. Steven Levy explique ce qui a incité Franz Och à rejoindre l’équipe de Google : 
Franz Och et ses collègues savaient qu’ils auraient accès à une quantité phénoménale de données ; ils ont donc tout repris à zéro, avec l’objectif de créer un nouveau système de traduction. « Nous avons pu, entre autres choses, construire des modèles linguistiques très, très, très larges, bien plus importants que tout ce qui a pu être élaboré dans l’histoire de l’humanité ».”[5]
Google Translate, un système de TA reposant sur des règles statistiques remplaçait le service basé sur les règles traditionnelles en 2007.
Alors, qu’est-ce qui rend Google Translate si différent ? J’ai trouvé l’évaluation la plus perceptive dans un livre récent et fort intéressant sur la traduction, écrit par David Bellos, Is That a Fish in Your Ear? [6] (NDT : disponible maintenant en français sous le titre Le poisson et le bananier- Une histoire fabuleuse de la traduction, chez Flammarion).
L’auteur consacre un des 32 chapitres de son livre à la traduction automatique, mais ce chapitre est un véritable joyau. (Voici une critique, en anglais, qui vous incitera peut-être à lire la version originale du livre dans son intégralité. [7]) David Bellos remarque que Google Translate (GT) ne traite pas du tout le sens. Cependant, la plupart du temps, le système fonctionne, ce qui est vraiment étonnant.” [8] Il mentionne que GT représente une réponse audacieuse à l’un des grands mythes de l’étude des langues modernes, et que l’on a invoqué pendant des décennies, sans qu’il y ait beaucoup de contestation en la matière ; à savoir que la particularité d’une langue était qu’il était possible de générer un nombre infini de phrases différentes à partir d’un ensemble fini de mots et de règles. … GT gère la traduction non pas en tenant compte que chaque phrase est différente mais selon le principe que toute phrase soumise pour traduction à GT existe, fort probablement, déjà quelque part. Quelle que soit, en principe, la définition d’une langue, dans la réalité elle sert le plus fréquemment à répéter les mêmes choses. [9]
et si GT ne fonctionne pas ... :
Il est en général facile de repérer les cas où GT n’a pas « su traduire » car le résultat n’a pas de sens, donc vous ne l’utilisez pas. (C’est aussi une des raisons pour lesquelles il ne faut jamais utiliser GT pour une traduction dans une langue que vous ne connaissez pas bien, mais seulement dans une langue dans laquelle vous êtes certain de pouvoir détecter les non sens).  Inversement, les traducteurs humains, produisent une prose particulièrement fluide et compréhensible ; vous ne pouvez détecter qu’ils se sont trompés que si vous comprenez aussi le texte source, auquel cas vous n’avez pas besoin de la traduction. [10]
Dans un tel cadre, on peut comprendre comment la nouvelle génération de moteurs de TA en ligne peut être utile au traducteur qui, comme moi, travaille à partir d’un logiciel de TAO. Le service de TA agit comme un complément aux mémoires de traduction que j’utilise, en me fournissant des phrases provenant d’un gigantesque corpus bilingue situé dans le « nuage », de manière instantanée et à un faible coût. [11] Si la traduction automatique d’un segment s’avère utilisable, même partiellement, je peux m’économiser beaucoup de frappe, en effectuant un copier-coller du segment traduit, puis en corrigeant ce qui a besoin de l’être. Si la traduction ainsi fournie est erronée ou incohérente, je l’élimine. Je pourrais, peut-être, ainsi économiser du temps et être bien plus productif. Je mets tout cela au conditionnel, car je n’ai pas encore essayé, mais ce sera bientôt le cas.
Dois-je m’inquiéter que l’automatisation me mette au chômage ? Non, car je ne vois aucune preuve que la TA soit capable d’effectuer la partie la plus importante de mon travail,l’élimination des ambiguïtés ou encore désambiguïsation lexicale [12]. Je ne peux donner une explication plus claire de ce processus qu’en citant Wikipedia [13] (en anglais) et Claude Piron :
Le regretté Claude Piron, traducteur aux Nations Unies et à l’OMS pendant de nombreuses années écrivit un jour que la TA, permet, au mieux, d’automatiser la partie la plus facile du travail du traducteur. La partie la plus difficile et qui prend le plus de temps, consiste à faire des recherches fouillées en vue de résoudre les ambiguïtés du texte source afin de respecter les exigences lexicales et grammaticales de la langue cible :
« Le grand public n’imagine pas le nombre d’heures perdues dans les services de traduction parce que les structures linguistiques anglaises sont fondées sur l’évocation. Il est arrivé, par exemple, qu’il faille écrire en Australie pour demander à un auteur si les sujets observés dans le German prisoner of war camp auquel il se référait vivaient dans un camp allié de prisonniers de guerre allemands ou dans un camp allemand de prisonniers de guerre alliés, l’expression anglaise étant susceptible des deux interprétations. »..[14]


[2]           Une API (application program interface) permet à un logiciel d’utiliser des données provenant d’une autre source, dans ce cas le service Google Translate, qui reste gratuit.
[3]           TAO : traduction assistée par ordinateur. Parmi les logiciels de TAO, on peut citer Trados, Wordfast, Déjà Vu, MemoQ.
[4]           Levy, Steven, In the Plex: How Google Thinks, Works, and Shapes Our Lives. Simon and Schuster, 2011.
[5]           Levy, ibid.
[6]           Bellos, David, Is That a Fish in Your Ear?: Translation and the Meaning of Everything. Macmillan, 2011.
[8]           Bellos, ibid, pp. 253-254.
[9]           Ibid., p. 257.
[10]           Ibid., p. 256.
[11]          Le prix actuel d’utilisation de l’API de GT est de 20 USD par million de caractères.
[12]         Voir http://www.technolangue.net/article.php3?id_article=294 On appelle désambiguïsation lexicale l’opération qui consiste à déterminer le sens d’un mot en contexte.
[13]          http://en.wikipedia.org/wiki/Machine_translation. Dans le cadre de la TA, l’élimination des ambiguïtés revient à une pré-éditique du texte source.

Nenhum comentário:

Postar um comentário


Seguidores