L'analyse des fréquences

Chapitre: V. Caractéristiques des langues Prérequis: -

Un des moyens les plus simples de chiffrer un message est de remplacer chaque lettre par une autre (ou un autre symbole). Par sa simplicité et par sa force, ce système a dominé la technique des écritures secrètes pendant tout le premier millénaire. Il a résisté aux cryptanalystes jusqu'à ce que le savant arabe Abu Yusuf Ya'qub ibn Is-haq ibn as-Sabbah Oòmran ibn Ismaïl al-Kindi (ouf!) mette au point, au IXème siècle, une technique appelée analyse des fréquences.

Al-Kindi (801-873) rédige sa méthode dans son plus important traité intitulé Manuscrit sur le déchiffrement des messages cryptographiques. C'est le premier manuscrit connu faisant mention des fréquences d'apparition des lettres (voir la première page de ce manuscrit ci-contre). Il explique que « la façon d'élucider un message crypté, si nous savons dans quelle langue il est écrit, est de nous procurer un autre texte en clair dans la même langue, de la longueur d'un feuillet environ, et de compter alors les apparitions de chaque lettre.
Ensuite, nous nous reportons au texte chiffré que nous voulons éclaircir et relevons de même ses symboles. Nous remplaçons le symbole le plus fréquent par la lettre première (la plus fréquente du texte clair), le suivant par la deuxième, le suivant par la troisième, et ainsi de suite jusqu'à ce que nous soyons venus à bout de tous les symboles du cryptogramme à résoudre ».

Cette technique ne fonctionne bien que si le cryptogramme est suffisamment long pour avoir des moyennes significatives.

Les pages suivantes indiquent les fréquences en français, en allemand, en anglais en espagnol et en russe. L'histogramme ci-dessous permet de comparer les fréquences dans les quatre premières langues (qui utilisent les lettres latines).


Référence


Didier Müller, 7.8.02