10 mars 2010

Google Translate, à la rescousse des langues menacées

Une initiative qui m’a l’air intéressante, par ce qu’elle permet :

• sauver des langues de l’oubli,

• ouvrir la possibilité de traduire d’une langue à l’autre au plus grand nombre,

• et aussi par la façon dont elle réalise ces traductions, non pas littéralement (comme certaines qu’on trouve grâce à des « traducteurs automatiques » avec des résultats plus que surprenants parfois, pour ne pas dire « rock and roll »), mais en associant l'humain à la machine et en intégrant des démarches individuelles, dans le cas des langues les plus menacées, comme le maori notamment.

Je vous laisse en juger.




googlejq.jpg

Le siège de Google à Mountain View, en Californie
D.-P. MORRIS / AFP






« Google translate, sauveur des langues en voie d'extinction »

Partout dans le monde,

des linguistes nourrissent le système de Google

afin de préserver leur patrimoine...



Une bête vorace. Plus elle mange, et plus la machine à traduire de Google est efficace.

Pour les principales langues, les sources sont nombreuses: comme Microsoft ou IBM, Google a injecté dans son système des traductions de millions de textes officiels, des Nations Unies ou de l'Union européenne notamment.


Mais pour les langues rares, Google se repose sur la contribution d'individus passionnés.
Dans le New York Times de mardi, un professeur néo-zélandais raconte comme il utilise l'outil Google Translator Toolkit pour télécharger des traductions anglais-maori.

«Pour nous, il s'agit de sauver notre langue de l'extinction. On essaie d'aider notre culture à survivre», explique Te Taka Keagan. Google Translator Toolkit est disponible pour plus de 345 langues, de l'abkhaze au zoulou, précise le quotidien.


Intelligence hybride
Dans les années 90, les linguistes privilégiaient l'approche visant à apprendre à une machine toutes les règles grammaticales d'une langue et à lui fournir un dictionnaire. Mais la subtilité du langage a rapidement montré les limites de cette méthode.

Une simple phrase comme «J'aime manger des croissants au petit déjeuner» donne «I like to eat crescents (crescent = la forme, comme un croissant de lune, ndr) with the breakfast» sur Yahoo tandis que Google traduit correctement «I love to eat croissants for breakfast».

L'homme qui a lancé la révolution chez Google s'appelle Franz Och, lauréat en 2003 d'un concours de traduction automatique organisé par DARPA (l'agence qui développe les technologies pour l'armée américaine).

Il se base sur une approche dite «statistique», avec une machine qui apprend par déduction, dans le contexte, grâce aux traductions qui lui ont déjà été fournies.


Un milliard de mots
Alfred Spector, vice-président en charge de la recherche et des projets spéciaux» expliquait à 20minutes.fr fin février que si certains ne jurent que par l'intelligence artificielle, Google préfère parler «d'intelligence hybride, avec l'association de l'homme et de la machine».

La tâche est dantesque.

Pour modéliser un langage, Google a besoin d'environ un milliard de mots, employés dans des combinaisons différentes.

Pour l'anglais, l'entreprise a injecté «plusieurs centaines de milliards» de termes, selon le New York Times.

Le maori n'en est pas là. Mais avec les efforts du Dr Keagan, peut-être rejoindra-t-il la cinquantaine de langage déjà disponibles dans Google translate.




A lire aussi : "Google promet un téléphone-traducteur d'ici deux à trois ans"


Miss You

Commentaires

Sauver des langues, j'applaudis bien fort.

Google a lancé depuis des années tout un tas de projets de ce type qui, certes, ont aussi pour but de favoriser son image et d'asseoir sa position de leader mais qui sont indéniablement utiles, accessibles et gratuites pour tous les internautes.

Il y a eu certains débordements, comme la tentative de numériser tous les livres de la planète sans juger utile d'en acquérir d'abord les droits. Mais cela n'empêche pas la multiplication d'autres réalisations aussi belles.

Ecrit par : Anna Galore | 10 mars 2010

Pour les "traductions automatiques", il y a encore du boulot...

C'est souvent un charabia bourré de fautes et de contresens... Je reconnais que c'est mieux que rien, mais ce n'est franchement pas satisfaisant...

Ecrit par : ramses | 10 mars 2010

"Pour les "traductions automatiques", il y a encore du boulot..."

Tout à fait d'accord, c'est AUSSI pour ça que je trouve l'initiative intéressante.

Et puis tout ce qui permet de sauvegarder des langues menacées, magnifiques liens avec le passé, l'histoire des hommes et de l'humanité, j'avoue être totalement pour !

Sauver pour ne pas avoir à regretter, sauvegarder pour ne pas oublier.

Ecrit par : Miss You | 10 mars 2010

google translator :

les plus
- 355 langues
- améliorable tout le temps par de vrais linguistes
- gratuit et facile d'usage

les moins
- complètement foireux.. c'est le pire traducteur automatique que je connaisse pour le français/anglais, anglais/espagnol, anglais UK/anglais US, japonais/anglais (j'ai pas osé tenté le japonais/français), français/italien
- utiliser de manière abusive sur plein de sites, de jeux en lignes, de logiciels, de sous-titrages -.- résultat on se retrouve avec des non-sens, des contre-sens, de fautes de grammaire partout ou des "il était mangé de partir", sans parler des mots qui se traduisent par différents mots dans une autre langue et google choisit toujours le mauvais :D

Ecrit par : Netsah | 10 mars 2010

Oui, oui, absolument, les logiciels de traductions - TOUS les logiciels de traduction - sont encore très très très loin de valoir quoi que ce soit d'utile.

Ce n'est pas pour ça que j'applaudissais et ce n'est d'ailleurs pas ce que l'article de 20 Minutes souligne non plus (Google Translator n'est pas une nouveauté qui date d'hier, ce n'est pas pour annoncer ça que l'article a été écrit).

Je le répète donc : "Sauver des langues, j'applaudis bien fort. "

Sauver des langues qui sont en voie de disparition en les numérisant sous formes de vocabulaire, d'expressions, de règles de grammaire, etc., oui, j'applaudis bien fort, parce que c'est sauver une partie du patrimoine culturel de l'humanité (que ce soit fait par Google ou un autre). Et rendre tout cela librement disponible à tous, c'est ce qui devrait toujours être le cas.

Pour traduire correctement un texte d'une langue vers une autre (même les plus courantes), il faudra encore vraisemblablement des décennies de progrès informatique pour y parvenir et encore ce n'est pas sûr. Mais, une fois de plus, ce n'est pas l'intérêt que l'auteur de l'article a vu, fort justement, à Google Translator.

Ecrit par : Anna Galore | 10 mars 2010

Pas mieux !

Ecrit par : Miss You | 11 mars 2010

ben oui o.O c'est pour ça que j'ai mis ma catégorie : les plus xD
Mais y a déjà des traducteurs comme reverso, systran ou d'autres qui sont nettement plus efficaces et corrects que google translation pour les langues les plus parlées. Après je suis d'accord, la sauvegarde numérique linguistique est une idée brillante, mais ça c'est presque banal venant de la team Google o.O ils ont essentiellement des idées géniales.. à part peut-être Google Chrome qui a encore besoin de beaucoup de réglages -.-

Ecrit par : Netsah | 11 mars 2010

"c'est presque banal venant de la team Google o.O ils ont essentiellement des idées géniales"

Nous sommes d'accord :-)

Ecrit par : Anna Galore | 11 mars 2010

Écrire un commentaire