Google se sert de vous pour numériser des livres
Par coyote, mercredi 19 octobre 2011 à 10:14 - Insolite - #548 - rss
Lancé en décembre 2004, le service Google Book à depuis l'an dernier dépassé la barre des quinze millions d'ouvrages numérisés. Dans le but d'améliorer son OCR (reconnaissance optique de caractères : c'est un logiciel qui récupère le texte depuis une image) et d'accélérer la numérisation des livres, la firme de Mountain View a trouvé il y a quelques années la solution parfaite. C'est pourquoi il y a maintenant deux ans, le géant du web s'est porté acquéreur de la start-up reCaptcha, une société spécialisée dans ces petites images que l'on trouve sur les sites web et qu'il faut déchiffrer afin d'accéder à un service donné, portant le nom de captcha.
Lorsque vous entrez un captcha de cette société, vous devez tapez deux mots afin de vérifier que vous êtes bien un utilisateur, et non un ordinateur (afin de lutter contre les spams). Deux mots? Pas tout à fait... En fait seul le premier mot va venir vérifier que vous êtes humain. Le second est en réalité un mot qui n'a pas pu être déchiffré par l'OCR de Google. Il va ainsi être soumis à de nombreux utilisateurs, et au bout d'un certain nombre de réponses identiques l'OCR va mémoriser ce mot afin de pouvoir le reconnaître dans le futur. Grâce à quelques 30 millions d'utilisateurs quotidiens du système sur pas moins de 100 000 sites, Google améliore grandement la fiabilité de son logiciel et fait valider des mots numérisés par des millions de personnes.
Source : Sur-la-Toile
Commentaires
Aucun commentaire n'est possible sur ce blog.