Les 5 caractéristiques les plus révélatrices sont:

  1. La plage de longueur des phrases. Nous les humains, écrivons parfois des phrases très courtes et parfois avec des phrases interminables qui partent dans tous les sens avant de revenir au sujet initial après un détour par nos pensées désordonnées. Au contraire, l’IA, elle, est plus constante.
  2. Le coefficient de variation des paragraphes. Nos paragraphes varient énormément en longueur, alors que ceux de l’IA sont plus réguliers.
  3. Le ratio de verbes. Les humains utilisent environ 16% de verbes contre 13% pour les IA, ce qui n’est pas une énorme différence, mais ça compte.
  4. La complexité grammaticale. Nos structures de phrases sont moins prévisibles (enfin, ça dépend pour qui…loool).
  5. La variabilité des paragraphes. Et encore une fois, l’IA aime trop l’ordre et la régularité, ce qui la trahi…
L’algorithme qui détecte tout ça s’appelle Random Forest (littéralement “forêt aléatoire”), ce qui permet de compter chaque virgule et d’analyser chaque structure de phrase pour ensuite voir ce qui se répète le plus. Le plus dingue c’est que cette méthode atteint 98,3% de précision !

Lire l'article complet de Korben sur son blog dont on a extrait ce passage.