Le cyberblog du coyote

 

Extra
Langues :

Editorial

Ce blog a pour objectif principal d'augmenter la culture informatique de mes élèves. Il a aussi pour ambition de refléter l'actualité technologique dans ce domaine.

lundi 28 février 2011

Quand les boîtes de GMail se vident

Plusieurs centaines de milliers de boîtes GMail se sont retrouvées vidées dimanche, et certaines le sont encore aujourd'hui. Les équipes de Google n'ont pas encore expliqué la source du problème, qu'elles résolvent progressivement et qui montre les limites de l'informatique en cloud.
C'est la révolution informatique que les industriels tentent d'imposer aux consommateurs depuis plusieurs années, et contre laquelle s'opposent des initiatives en gestation comme la FreedomBox. Avec le cloud, ou « informatique en nuage », les entreprises comme Google, Microsoft, Apple ou Yahoo veulent rendre les utilisateurs dépendants des services en ligne, pour transformer leurs ordinateurs en terminaux d'accès – sous un motif écologique à la mode mais contestable. Les données ne sont plus stockées localement mais à distance, ce qui a le double avantage pour l'entreprise d'enfermer l'utilisateur dans le service en ligne qu'il a choisi (particulièrement lorsqu'il est impossible ou difficile d'en changer sans perdre ses fichiers), et de lui faire payer un loyer pour l'hébergement de ses données. Loyer qui peut être payé soit par la communication de données personnelles exploitées commercialement (revente de fichiers, publicité ciblée...), soit par abonnements payants.

Le courrier dans les nuages

Google fait figure de leader dans ce domaine, avec ses très nombreux services en ligne comme YouTube, Google Docs, Google Maps, ou encore GMail. L'utilisateur n'a plus besoin d'installer de logiciels et de les mettre à jour, il doit juste disposer d'un navigateur Internet, ce qui est l'objectif de Chrome OS. Les données seront sauvegardées à distance et pourront être retrouvées depuis n'importe quel appareil dans le monde. C'est la promesse d'une informatique simplifiée et la fin des données perdues après le crash d'un disque dur ou la perte d'une clé USB. Sauf lorsque le service plante et que tout devient inaccessible. Ce fut le cas dimanche de GMail. Selon le propre aveu des équipes de Google, un peu moins de 0,29 % des boîtes des utilisateurs de GMail (soit tout de même plusieurs centaines de milliers d'internautes) ont été vidées de leur contenu. Cinq heures après la première alerte publiée, le problème touchait encore 0,08 % des utilisateurs. À priori aucun message n'est perdu, mais les équipes de la firme de Mountain View doivent réparer des bases données endommagées pour récupérer les données.
Ce genre de problème est le cauchemar de tout éditeur de services en cloud, et met en exergue le risque de confier toutes ses données à un tiers distant. Le jour où le service tombe en panne, ferme ses portes ou désactive le compte de l'utilisateur, toutes les données sont perdues.

Source : Futura-Sciences

samedi 26 février 2011

Ferme à contenu

Une ferme à contenu est un site qui publie un (très) grand nombre d'articles, sur des sujets précis ayant été préalablement identifiés comme des sujets recherchés par les internautes et donc susceptibles de générer du trafic (et donc des revenus).

Pour aller au bout des choses et pousser l'optimisation aussi loin que possible, les éditeurs de ces sites doivent bâtir une système constitué de plusieurs "briques" :

  • un algorithme qui détecte les demandes des internautes et produit en sortie une multitude de sujets d'articles à écrire. C'est en quelque sorte le royaume de Google Trends ou Insights for Search !
  • une plateforme permettant de trouver un rédacteur pour chaque article, le plus rapidement et le moins cher possible. Les contraintes imposées sont malheureusement susceptibles de contribuer à la création d'articles de faible qualité...
  • un CMS permettant de publier les articles de manière ultra optimisée pour le référencement, tout en monétisant le site en général par la publicité
  • des outils de web analytics pour mesurer les performances des articles publiés
Il ne faut pas confondre "fermes à contenu" et "agrégateurs de contenus" (qui republient des articles ou extraits déjà publiés ailleurs) ou sites communautaires et/ou à contenu généré par les utilisateurs (UGC). Wikipédia ou les forums ne sont donc pas des fermes à contenu.

En février 2011, Google a modifié son algorithme pour tenter de repérer les fermes à contenu afin de réduire leur visibilité dans les résultats.

Source : Dico du Net

vendredi 25 février 2011

Petit programmeur


Source : Geek & Poke

jeudi 24 février 2011

Des écrans tactiles partout

mercredi 23 février 2011

Genèse d’un algorithme

D’où viennent ces algorithmes que les auteurs d’Interstices décortiquent et analysent avec tant de brio et de clarté ? Certes, ils sont le produit de l’intelligence humaine, chaque algorithme ayant été ingénieusement conçu pour résoudre une classe de problèmes plus ou moins étendue. Mais, comment, en pratique, conçoit-on un algorithme ?

Lire l'article d'interstices

mardi 22 février 2011

Une révolution permanente

Née au milieu du vingtième siècle avec les premiers calculateurs électroniques, l’informatique n’a cessé de se développer, touchant tous les secteurs d’activité.

Lire l'article d'Interstices

vendredi 18 février 2011

Watson a gagné au Jeopardy !

Un superordinateur conçu par IBM et dénommé Watson a remporté un jeu télévisé aux États-Unis. Son secret : il comprend les questions, répond en langage naturel et puise dans une énorme base de données.

En remportant deux manches sur trois, Watson a gagné 1 million de dollars au jeu Jeopardy. Si Watson est devenu célèbre ce matin, c’est parce qu’il s’agit d’un ordinateur et d’un logiciel. IBM, le concepteur, réédite ainsi son exploit de 1997 quand son Deep Blue avait battu au jeu d’échecs le champion du monde de l’époque, Gary Kasparov. Depuis, l'informatique a gagné en puissance et, en 2006, c'est un PC animé par un logiciel du commerce, Deep Frtitz, qui a battu le champion du monde russe Vladimir Kramnik.
L’écran était installé entre les deux joueurs humains et l’ordinateur, commandé par un opérateur, devait répondre aux questions de culture générale posées par l’animateur. Watson (du nom du fondateur d’IBM, Thomas Watson) étant sourd et muet, l’opérateur tapait les questions sur le clavier et annonçait ses réponses. Ses adversaires humains n’étaient pas les premiers venus : la machine a combattu en effet les deux plus brillants compétiteurs de l’Histoire de ce jeu, revenus sur le plateau pour ce match du siècle. Des vidéos (en anglais bien sûr) immortalisent l'événement.
Avec ses 15 To (téraoctets) de mémoire vive (15 x 1.024 gigaoctets, donc), ses 2.880 processeurs Power 7, Watson n’a rien d’un micro. « S’ils tournaient sur un microordinateur de bureau, les logiciels mettraient 2 heures pour répondre à une question » affirme-t-on chez IBM. Comme ses adversaires, Watson n’avait pas accès à Internet mais avait tout de même un avantage certain : IBM avoue que Watson disposait d’une antisèche équivalent à 200 millions de pages.

Au menu : la miche de pain de Jean Valjean

L’exploit n’en est pas mince pour autant. Les questions, posées en langage naturel, devaient être analysées par une kyrielle d’algorithmes, qui en extrayaient le sens et les mots clefs. À la question « Recherché pour le vol d’une miche de pain dans Les Misérables », il fallait bien sûr répondre « Jean Valjean ». Watson pouvait ensuite, comme le prescrit la règle du jeu, poser des questions supplémentaires pour obtenir des précisions (et réduire le gain). Restait alors à explorer la gigantesque base de données.
Ce genre d’analyse rappelle celle de Wolfram Alpha, le moteur de recherche censé accepter des requêtes en langage naturel (en anglais) mais qui défaille souvent lorsqu’on l’interroge sur des questions de culture générale (il ne connaît apparemment pas Jean Valjean, par exemple). On peut rêver d’un Watson en ligne qui utiliserait Internet comme base de données…

Source : Futura-Sciences

jeudi 17 février 2011

True Knowled?e

Le site trueknowledge.com se présente comme un moteur de « réponses » afin de se distinguer d'un simple moteur de recherche. L'idée principale est de fournir des réponses à des questions directes, d'après les créateurs du site.
Ce site serait capable de répondre à des milliards de questions, un peu comme l'option « j'appelle un ami » dans le célèbre jeu télévisé. Il peut s'agir d'une question étrange ou même d'une question scientifique pointue. Le site n'est pas là pour donner des références aux articles qui ont servi pour répondre. Le site serait modeste, car s'il n'a pas la réponse, il répondra qu'il ne sait pas. Le site utilise des algorithmes puissants sur le plan de l'interprétation sémantique ; il se repose aussi sur chacha.com.
À la question : « What is the meaning of life, the universe and everything? », le site répond effectivement juste : « 42 ». À la question : «Who is the fairest one of all » (réponse : Blanche-neige), le site donne Cendrillon. Aux questions « What is the best internet answer engine ? » ou « What is true knowledge useful for? », le site avoue ne pas répondre. Étonnant, non ?

Source : Sur-la-Toile

mercredi 16 février 2011

Jeopardy: un ordinateur peut-il battre les champions?

Ces jours-ci a lieu une première dans l’histoire du jeu télévisé et peut être une première dans l’histoire de l’informatique. Un ordinateur va affronter des concurrents humains à Jeopardy, dont le principe est de trouver les questions à partir de réponses données. L’enjeu est de taille, car outre la base de données gigantesque dans laquelle l’ordinateur – appelé Watson – doit fouiller, il doit en outre comprendre les subtilités de la langue. Et c’est là tout l’intérêt de cette expérience, car l’esprit humain réalise des prouesses quand il saisit les nuances et les différents degrés d’une phrase, comme avec les jeux de mots par exemple. IBM travaille depuis sept ans sur ce programme et espère bien, avec cette participation médiatique, s’inscrire dans l’histoire de l’intelligence artificielle.


Avant-hier soir avait lieu la première rencontre, et pour l’instant, le champion en titre Brad Rutter et Watson sont à égalité. Il reste encore deux manches pour départager l’homme de la machine. Mais le risque plane que dans quelques années, à «Watson», il faille répondre: «Quel était le nom du premier ordinateur a avoir remporté la finale de Jeopardy?»

Source : Nouvo

mardi 15 février 2011

L'art du commentaire


Source : Geek & Poke