Aeneas, la nouvelle intelligence artificielle de Google, est capable d’estimer la date et le lieu d’écriture des textes anciens en latin endommagés. Elle est ensuite capable de prédire les caractères manquants.
L'Empire romain nous a laissé un grand nombre d'inscriptions, mais beaucoup ont été endommagées par le temps. Lettres indéchiffrables, supports cassés, c'est un vrai casse-tête pour les historiens qui tentent de les reconstituer. Et chaque année, 1500 nouvelles inscriptions latines sont découvertes.
Pour venir en aide aux historiens, voici Aeneas, une nouvelle intelligence artificielle développée par Google et l'université de Nottingham au Royaume-Uni. Dans un article publié dans la revue Nature, les chercheurs expliquent comment Aeneas peut assister les historiens non seulement pour trouver les origines des inscriptions et identifier d'autres inscriptions similaires, mais aussi pour compléter les parties de texte manquantes.

Restauration d’un diplôme militaire de Sardaigne 113/14 C.E. (CIL XVI, 60). © Google
Quand l'intelligence artificielle déverrouille le passé
En contextualisant les textes anciens, l’IA peut s'appuyer sur les similitudes avec d'autres écrits - aussi bien visuelles que linguistiques, pour établir des parallèles et ainsi deviner ce qui manque. Bien sûr, l'IA de Google n'est pas toujours exacte. Sa précision est estimée à 73 % pour des trous dans un texte de jusqu'à dix caractères, et de 58 % lorsque la longueur est inconnue.
C'est un travail que les historiens effectuent déjà à la main. Aeneas fournit toutes les étapes de son raisonnement, leur offrant ainsi un gain de temps conséquent et la possibilité de vérifier ses résultats. De plus, elle est capable de repérer des similitudes ou des détails que les historiens auraient pu manquer. L’IA a été entraînée sur plus de 176 000 inscriptions en latin, provenant notamment des bases de données Epigraphic Database Roma (EDR), Epigraphic Database Heidelberg (EDH) et Epigraphic Database Clauss Slaby (EDCS-ELT).
L'outil peut être utilisé pour d'autres langues anciennes, scripts et médias, y compris les papyrus et les pièces de monnaie. Google annonce l'avoir déjà intégré dans l'outil Ithaca pour le grec. Aeneas est
disponible gratuitement. De plus, il est sous licence libre, et le code ainsi que les données sont disponibles
sur GitHub.
Source : Edward Back sur Futura