Le mystère du manuscrit de Voynich
Pour la Science no 323, Septembre 2004
Gordon Rugg est professeur au Département de mathématiques
et d'informatique de l'Université de Keele, en Angleterre, et
rédacteur en chef de la revue Expert Systems.
Une nouvelle analyse d'un document médiéval énigmatique
suggère qu'il ne contient que des suites de mots dépourvues
de sens.
En 1912, Wilfrid Voynich, un libraire américain spécialiste
de livres rares, fit la découverte de sa vie dans la bibliothèque
de la Villa Mandragone près de Rome: un manuscrit de quelque
230 pages écrit en caractères étranges et illustré
de surprenants dessins de plantes, de sphères célestes
et de baigneuses. À première vue, le manuscrit ressemblait
à un manuel d'alchimiste ou d'herboriste, mais il était
entièrement codé. Certains détails des illustrations
suggéraient que l'ouvrage avait été rédigé
entre 1470 et 1500, et une lettre du XVIIe siècle jointe au manuscrit
indiquait qu'il avait été acheté en 1586 par l'Empereur
Rodolphe II. Le manuscrit avait ensuite disparu jusqu'à ce que
Voynich le redécouvre.
Voynich a demandé aux meilleurs cryptographes de l'époque
de décoder les caractères étranges, qui ne correspondent
à aucune écriture connue. Cependant, après 90 années
d'efforts, personne n'a été capable de déchiffrer
le manuscrit, et sa nature comme son origine restent un mystère.
Devant ces échecs répétés, on a commencé
à douter de l'existence d'un message à déchiffrer:
le manuscrit de Voynich est peut-être un canular sophistiqué
dépourvu de sens.
Comment un mystificateur aurait-il pu concevoir 230 pages présentant
tant de régularités dans la structure et la répartition
des mots? Le manuscrit de Voynich semble trop compliqué pour
n'être qu'un assemblage de mots incohérent. J'ai toutefois
découvert que l'on peut reproduire bon nombre de ses caractéristiques
à l'aide d'un outil de codage simple qui existait au XVIe siècle.
Le texte engendré grâce à cette technique ne peut
évidemment avoir de sens, mais il ressemble pourtant étrangement
au manuscrit original. Ce résultat ne prouve pas que le manuscrit
de Voynich soit une mystification, mais il renforce la théorie
selon laquelle un aventurier anglais du nom d'Edward Kelley aurait fabriqué
le document pour escroquer Rodolphe II. L'empereur aurait acheté
l'oeuvre 600 ducats, soit près de 50 000 euros actuels.
La première tentative de décryptage du manuscrit de Voynich
à l'époque moderne date de 1921. William Newbold, un professeur
de philosophie de l'Université de Pennsylvanie, a remarqué
que chaque caractère de l'écriture du manuscrit, souvent
appelée « voyniche », présentait de minuscules
traits visibles au microscope. Selon lui, ces traits étaient
des coups de plume et formaient une sténographie grecque ancienne.
En interprétant ce code, Newbold a prétendu que le manuscrit
de Voynich avait été écrit par le philosophe du
XIIIe siècle Roger Bacon. Quelques années plus tard, cependant,
on s'est aperçu que les traits microscopiques n'étaient
en fait que des craquelures naturelles de l'encre.
L'oeil du bébé dieu
L'essai de Newbold a été le premier d'une série
d'échecs. Dans les années 1940, les décodeurs amateurs
Joseph Feely et Leonell Strong ont tenté de substituer des lettres
romaines aux caractères voyniches, mais les diverses transcriptions
n'ont donné aucun résultat sensé. À la fin
de la Seconde Guerre mondiale, les cryptographes de l'armée américaine
se sont essayés à décoder des textes cryptés
antiques. Tous ont livré leurs secrets, à l'exception
du manuscrit de Voynich. En 1978, le philologue amateur John Stojko
a déclaré que le texte était de l'ukrainien dont
on avait supprimé les voyelles. Sa traduction ne correspond cependant
ni aux illustrations du manuscrit ni à un quelconque élément
de l'histoire ukrainienne, et comporte des phrases telles que «le
vide est ce pour quoi lutte l'oeil du bébé dieu»!
En 1987, un médecin nommé Leo Levitov a affirmé
que le document était l'oeuvre des Cathares et qu'il était
écrit avec un mélange de mots de différentes langues,
mais son interprétation ne concorde pas avec la théologie
cathare.
Les spécialistes s'accordent pour dire que toutes ces tentatives
de décodage sont entachées d'une grande ambiguïté.
Un mot voyniche peut y être traduit de diverses façons
selon son emplacement dans le texte. La solution de Newbold nécessitait
ainsi le décryptage d'anagrammes. Ober, par exemple, peut être
interprété comme robe, orbe ou bore, ce qui introduit
une certaine imprécision. À l'inverse, aucune de ces méthodes
ne permet de coder un texte en clair en un texte crypté présentant
les propriétés du voyniche.
Si le texte n'est pas un code, peut-être est-il un langage non
identifié? Pour représenter les mots du manuscrit, il
existe une convention de translittération des caractères
voyniches en lettres romaines, «l'alphabet voyniche européen».
Une analyse statistique du texte révèle une très
grande régularité. Les mots les plus courants apparaissent
souvent plus de deux fois dans une ligne. Par ailleurs, le texte présente
un taux de répétition qui n'a d'équivalent dans
aucun langage connu. Dans le folio 78 recto, par
exemple, on lit qokedy qokedy dal qokedy qokedy. Inversement, le voyniche
contient très peu de phrases dans lesquelles plus de trois mots
différents apparaissent ensemble. Ces caractéristiques
rendent improbable que le voyniche soit un langage humain: il est trop
différent de toutes les autres langues.
Autre possibilité, le manuscrit est un canular échafaudé
pour réaliser une escroquerie, ou une élucubration de
quelque fou érudit. Sa complexité linguistique semble
infirmer cette théorie. Outre la répétition de
mots, on observe de fortes régularités dans leur structure
même. La syllabe qo, très fréquente, ne se rencontre
qu'en tête d'un mot. La syllabe chek peut apparaître au
début d'un mot, mais quand la syllabe qo est aussi présente,
elle la précède toujours. La syllabe dy apparaît
habituellement en fin de mot, parfois au début, mais jamais au
milieu. Une combinaison aléatoire de syllabes ne produit pas
autant de régularités.
Le voyniche est aussi beaucoup plus complexe que tous les langages pathologiques
connus dus à des troubles psychologiques ou à des lésions
cérébrales. Même si un fou avait inventé
une grammaire et une écriture correspondante, le texte obtenu
ne présenterait pas les propriétés statistiques
du manuscrit de Voynich. Les longueurs des mots du voyniche, par exemple,
suivent une distribution binomiale: les mots les plus courants comptent
cinq à six caractères et la fréquence des mots
de longueur différente de cette valeur décroît fortement,
dessinant une courbe en cloche symétrique. Cette distribution
est très rare dans les langages humains. La répartition
des longueurs des mots y est plus étalée et asymétrique,
les mots relativement longs étant assez fréquents. Il
est très improbable que la distribution binomiale du voyniche
soit une propriété délibérée, car
ce concept statistique n'a été inventé que plusieurs
siècles après la rédaction du manuscrit.
Le manuscrit de Voynich semble n'être à première
vue ni un texte codé, ni un langage inconnu, ni une production
aléatoire. Alors quoi? Pour sortir de cette impasse, ma collègue
Joanne Hyde et moi-même avons réévalué chacune
de ces pistes. L'estimation selon laquelle les caractéristiques
du voyniche sont incompatibles avec tout langage humain est fondée
sur une expertise linguistique pertinente et solide. L'impuissance des
meilleurs cryptanalystes face au texte rend peu plausible l'existence
d'un message caché. Reste l'hypothèse de la mystification,
rejetée par la plupart des connaisseurs, qui considèrent
que le manuscrit de Voynich est trop complexe pour être un faux.
Cette opinion ne repose cependant sur aucune évidence. On ne
sait presque rien des méthodes de reproduction d'un long texte
médiéval codé, car il n'y a pratiquement pas d'exemples
de ce genre.
Un code pour la tromperie
Plusieurs chercheurs, comme Jorge Stolfi de l'Université de
Campinas au Brésil, se sont demandé si le manuscrit de
Voynich a été construit à l'aide de tableaux de
production aléatoire de texte. Les cases de ces tableaux comprennent
des syllabes, que l'utilisateur sélectionne, par exemple en jetant
des dés, et combine de façon à former un mot. Cette
technique pourrait engendrer certaines des régularités
observées dans les mots voyniches. La première colonne
du tableau pourrait contenir des syllabes constituant un préfixe
tel que qo, qui n'apparaît qu'en début de mot, la seconde
colonne, des infixes - syllabes apparaissant au milieu des mots - comme
chek, et la troisième colonne des suffixes, tels que y. En choisissant
séquentiellement une syllabe dans chaque colonne, on produit
des mots possédant la structure caractéristique du voyniche.
Des cases vides permettent de produire des mots dépourvus de
préfixe, d'infixe ou de suffixe.
Certaines propriétés du voyniche ne sont cependant pas
aussi simples à reproduire. Des caractères courants pris
individuellement peuvent n'être que rarement associés à
d'autres. Les caractères transcrits en a, e et l, ainsi que la
combinaison al, sont fréquents, mais la syllabe el est très
rare. Cet effet ne peut être produit en mélangeant de façon
aléatoire des caractères contenus dans un tableau.
Le tirage aléatoire est cependant la notion clé. Ce concept
n'a été précisé que longtemps après
la réalisation du manuscrit, de sorte que dans une construction
aléatoire médiévale, la combinaison des syllabes
a probablement été effectuée autrement. Les mots
formés ne seraient alors pas strictement aléatoires au
sens statistique. Certaines caractéristiques du voyniche sont
peut-être ainsi la marque d'un ancien système de codage.
Nous avons essayé de produire un document contrefait pour voir
quels effets apparaîtraient. Quelle technique utiliser? La réponse
dépend de la date de création du manuscrit. Il est illustré
dans le style du XVe siècle, et il existe un consensus sur le
fait qu'il est antérieur à 1500. Pour autant, les oeuvres
artistiques imitent souvent le style d'une période antérieure,
innocemment ou pour faire paraître le document plus ancien. Le
style ne permet pas de dater précisément le manuscrit.
J'ai donc cherché une technique en vigueur durant une période
plus large, entre 1470 et 1608.
La grille de Cardan, introduite
par le mathématicien italien Girolamo Cardano en 1550, est une
possibilité prometteuse. C'est une sorte de carte à trous.
Lorsqu'on la superpose sur un texte apparemment anodin créé
à l'aide d'une copie de la même carte, les fenêtres
révèlent les mots du message caché. J'ai pensé
qu'à l'inverse cette même grille
de Cardan à trois fenêtres permet de sélectionner
des groupes de préfixes, infixes et suffixes dans un tableau
pour fabriquer des mots de style voyniche.
Un code, mais pas de message
Une page type du manuscrit de Voynich contient entre 10 et 40 lignes,
chacune comptant 8 à 12 mots. En utilisant le modèle du
voyniche à trois syllabes, un seul tableau de 36 colonnes et
40 lignes contient assez de syllabes pour produire une page entière
du manuscrit avec une seule grille. La première colonne donne
la liste des préfixes, la seconde celle des infixes et la troisième
celle des suffixes. Les colonnes suivantes répètent ce
motif. On aligne la grille sur le coin supérieur gauche du tableau
pour créer le premier mot, puis on la déplace de trois
colonnes vers la droite pour former le mot suivant. On peut aussi déplacer
la grille d'une ligne vers le bas ou d'une colonne vers la droite. En
plaçant successivement la grille sur différentes parties
du tableau, on crée des centaines de mots voyniches. Le même
tableau peut ensuite être utilisé avec une autre grille
pour former les mots de la page suivante. Avec trois tableaux et une
dizaine de grilles, j'ai produit en peu de temps environ 2 000 mots.
Cette méthode permet de reproduire aisément les caractéristiques
du voyniche. On peut s'assurer que certains caractères ne se
côtoient jamais en concevant soigneusement les tableaux et les
grilles. Si les fenêtres de la grille sont sur des lignes différentes,
les syllabes de cases adjacentes horizontalement ne seront jamais accolées,
même si elles sont très courantes individuellement. La
distribution binomiale des longueurs des mots est obtenue en mélangeant
des syllabes courtes, moyennes et longues dans le tableau. En voyniche,
les premiers mots d'une ligne ont tendance à être plus
longs que les derniers. Il suffit pour reproduire cette propriété
de placer les syllabes longues dans la partie gauche du tableau. Mes
essais suggèrent qu'une personne aurait pu produire le manuscrit
de Voynich en seulement trois ou quatre mois à l'aide de la méthode
de la grille de Cardan.
Pour déterminer si le manuscrit n'est qu'un fatras insensé
ou s'il recèle un message crypté, j'ai imaginé
deux façons d'employer les grilles et les tables pour coder un
texte en clair. La première est de convertir les caractères
du texte en clair en infixes qui sont ensuite insérés
entre des préfixes et des suffixes ayant un sens à l'aide
de la grille de Cardan. Une seconde
technique possible est d'assigner un nombre qui spécifie l'emplacement
de la grille de Cardan sur le tableau
à chaque caractère du texte en clair. Cependant, ces techniques
aboutissent à des écritures beaucoup moins répétitives
que le voyniche. Ce résultat suggère que, si la grille
de Cardan a effectivement été employée pour
rédiger le manuscrit de Voynich, l'auteur a sans doute transcrit
des suites de mots incohérentes plutôt qu'un texte sensé.
Ces travaux ne démontrent pas que le manuscrit est un canular,
mais ils montrent que sa réalisation était possible à
l'époque. Le fait que l'érudit élisabéthain
John Dee et son associé Edward Kelley se sont rendus à
la cour de Rodolphe II dans les années 1580 renforce cette hypothèse.
Kelley était un faussaire notoire, un mystique et un alchimiste
familier des grilles de Cardan. Certains experts du manuscrit de Voynich
le suspectent depuis longtemps d'en être l'auteur.
Avec une de mes étudiantes, Laura Aylward, nous cherchons actuellement
à reproduire des caractéristiques statistiques plus complexes
par la technique des grilles de Cardan. Pour ce faire, nous tentons
d'automatiser la méthode, afin de produire de grandes quantités
de texte. Peut-être parviendrons-nous ainsi à percer le
secret plusieurs fois centenaire du plus mystérieux des manuscrits
médiévaux.
- G. Rugg, The Voynich manuscript : an elegant hoax? in Cryptologia,
vol.28, n°1, janvier 2004.
- A. Casanova, Méthodes d'analyse du langage crypté, une
contribution à l'étude du manuscrit de Voynich, thèse
de l'Université Paris VIII, 1999. http://voynich.free.fr/
- Des informations sur le site http://www.voynich.nu/
|