L'année passée, j'avais demandé à quelques IA de résoudre des problèmes de maths. Les résultats étaient assez bluffants. Qu'en est-il après une année ? Voici le résultat :


Plusieurs constats:
  • Perplexity est très puissant pour faire des recherches sur le web, mais pas pour faire des maths...
  • Les IA chinoises sont impressionnantes, surtout Qwen et Kimi qui obtiennent le score maximum.
  • Les méconnues IA suisses (Euria et Lumo) sont elles aussi très bonnes.
  • Ma chouchoute de l'année passée, MathsGPT, s'est encore améliorée, et reste ma préférée.
  • Claude est aussi très efficace.