Wikipedia : 4'573 degrés de séparation
Par Didier Müller, mercredi 25 juin 2008 à 07:17 - Insolite - #1005 - rss
Les habitués de Facebook et autres réseaux sociaux connaissent bien la théorie des « six degrés de séparation », selon laquelle il faut au maximum six liens personnels pour me relier à n’importe quelle personne d’un réseau, voir du monde. Je connais untel, qui connaît machin, qui connait George Bush. Simple.
Peut-on appliquer ce concept aux données, aux briques de savoir, grâce aux liens hypertexte ? La base de données de Wikipedia est l’outil idéal pour s’amuser un peu. Plusieurs outils permettent en effet de calculer le plus court chemin entre deux notions présentes dans Wikipedia. Stephen Dolan a réalisé un algorithme en ce sens, grâce à un « dump » de la base Wikipedia datant du moi de mars. Il suffit de rentrer deux termes dans son moteur de recherche pour connaître le nombre de clics nécessaires pour aller de l’un à l’autre en suivant les liens hypertexte.
Ainsi, pour aller de « Darth Vader » (le père de qui vous savez) à « Eddie Vedder » (le chanteur de Pearl Jam), il faut 3 clics, les étapes intermédiaires étant Country Music et Mandolin. Omnipelagos, un outil similaire, propose d’autres chemins (les étapes sont par exemples Alderaan => Red Hot Chili Peppers ou Marty McFly => Guitar), et permet de voir le texte environnant les liens.
Dolan a également calculé la distance moyenne de chaque article Wikipedia vers tous les autres, pour déterminer le « centre » de l’encyclopédie collaborative. Selon lui, en mars 2008, il s’agissait de la notice « 2007 », qui peut-être reliée à 2'111'479 autres articles, via une distance moyenne de 3.45 clics. En éliminant d’office tous les articles du type « liste d’évènements », le centre se déplace vers la notice « United Kingdom » (distance moyenne de 3.67 clics), suivie de Billie Jean King (3.68) et United States (3.69).
Le classement total est ici (fichier compressé de 37 MB !). On y découvre que la France est 1364eme (3.81), perdue entre le 400 mètres haies et la liste des épisodes de One Piece… Au final, le degré de séparation d'un article à un autre serait en moyenne de 4'573.
Source : Suivez le Geek
Commentaires
Aucun commentaire n'est possible sur ce blog.