Le code Copiale : un manuscrit mystérieux décrypté
Par Didier Müller, vendredi 28 octobre 2011 à 22:19 - Cryptographie - #1929 - rss
Le manuscrit dit de Copiale, entièrement crypté, vient d’être « cassé » par un logiciel utilisant des méthodes… de traduction. Verdict : ce long texte est une description de rites étranges organisés par une société secrète du XVIIIe siècle.
Baptisé Copiale (un de ses rares mots écrits en clair), ce livret de 105 pages retrouvé dans des archives de l’ex-Allemagne de l’Est défiait les spécialistes de la cryptographie. Il faut dire que l’on y trouve pêle-mêle des caractères latins, grecs et symboliques. On repère par exemple le signe désignant le sexe femelle ou celui qui, en mathématique, indique l’infini, ou encore des formes géométriques variées.
L’équipe réunie autour du « code Copiale » est composée de linguistes. Kevin Knight est Américain, Beáta Megyesi et Christiane Schaefer sont Suédois. Ils n’ont pas utilisé les armes de la cryptographie mais celles de la traduction. En somme, il s’agit de considérer un texte codé comme s’il était écrit dans une langue étrangère. L’idée n’est pas nouvelle et a été émise par Warren Weaver, un théoricien de la traduction, qui a proposé de rapprocher les méthodes de la cryptographie et de la traduction (on peut remarquer que Kevin Knight travaille à la SDL Weaver, née de la fusion de SDL et Language Weaver Inc.).
Cryptographie subtile
Les outils de l’équipe sont ceux de la traduction statistique. Alors que la méthode linguistique analyse la syntaxe des phrases, la traduction statistique puise dans des bases de données les plus vastes possibles pour dénicher des traductions déjà faites. Google s’est fait le champion de cette voie en utilisant sans limite le travail déjà réalisé par des traducteurs humains ou informatiques.
Pour l’appliquer au texte de Copiale, l’équipe a d’abord fait l’hypothèse que seuls les caractères latins avaient une signification. Devant l’échec, les linguistes ont postulé l’inverse, considérant qu’ils n’étaient là que pour embrouiller le problème (ces caractères sont des « nulles » dans le jargon de la cryptographie). Il a ensuite semblé que le code était « homophonique », c’est-à -dire qu’un caractère originel peut être codé par plusieurs signes, dont le nombre est proportionnel à la fréquence habituelle de ce caractère dans la langue originelle.
En considérant que le texte était en allemand et en comprenant que le signe « : » doublait la consonne précédente, les linguistes ont finalement abouti à un texte en clair. Sur son site Web, l’équipe donne toutes les indications et on y trouve également les versions en allemand et en anglais du code Copiale. On comprend que ce document décrit les étranges pratiques d’une secte secrète inconnue particulièrement intéressée par l’ophtalmologie. On y apprend dans le détail le déroulement de cérémonies d’intronisations de nouveaux membres.
Le décryptage de ce genre de textes est donc davantage qu’un jeu. Il apporte aussi du grain à moudre pour les historiens. Kevin Knight s’est attaqué cette année à un autre document, encore plus célèbre, le manuscrit de Voynich. Ce long texte écrit avec des caractères inconnus, qui daterait du XIVe siècle, défie à ce point les tentatives de décryptage que certains concluent à une supercherie. D’après Kevin Knight, c’est bien un texte réel mais son code résiste encore. Les méthodes de traduction statistiques en viendront-elles à bout ?
Source : Futura-Sciences
Commentaires
Aucun commentaire n'est possible sur ce blog.