jeudi 30 octobre 2008
Traduction automatique
Par coyote, jeudi 30 octobre 2008 à 07:27 - Intelligence artificielle
En matière de traduction automatique, la marge de progression est énorme. Discipline complexe mais assurément utile, la traduction par programme est l'objet de nombreuses recherches. Un organisme américain a noté les moteurs de traductions. Dans les premiers rangs, un des grands de l'informatique : Google.
Le rapport a été publié le 1er novembre. Il avait pour objectif de faire un état de l'art dans la traduction automatique. Les exemples choisis ont été des traductions de l'arabe et du chinois (mandarin) vers l'anglais. Les sources à traduire venaient des grandes agences de presse, de newsgroups et des médias traditionels. Le score de chaque traducteur a été évalué avec des méthodes de mesures statistiques, notamment la méthode BLEU de IBM.
Avec les différentes notations, on obtient plus de 20 classements. Cependant, on voit apparaître un acteur bien connu de l'informatique dans les premières places (souvent numéro 1) : Google.
Au lieu de se pencher sur les structures grammaticales et les approches anthropologiques de tout bord (comme tout bon chercheur en linguistique), Google a préféré l'approche statistique et ça marche plutôt bien. L'algorithme découpe le texte en phrases simples. Puis, on recherche des traductions déjà effectuées pour ces phrases simples. Le moteur évalue chaque solution et choisit la meilleure suivant ses statistiques et le contexte. Ce n'est plus la construction grammaticale qui compte mais les données qui ont déjà été traduites dans le passé. Google, expert en moteur de recherche, devient expert en traduction.
Sources : Sur la Toile, NIST 2006 Machine Translation Evaluation Official Results
lu 4122 fois