dimanche, juillet 06, 2008

La théorie des PETITS MONDES appliquée à Wikipédia

Quel est le centre de Wikipedia ? Et quel est son diamètre ? Voila par exemple quelques-unes des questions étranges qu'on peut se poser lorsqu'on étudie la théorie des “petits mondes”, ce champ des mathématiques qui analyse la configuration des relations au sein d'un réseau.

L'exemple le plus connu dans ce domaine est la notion des “six degrés de proximité” existant entre tous les êtres humains. Dès les années 60, Stanley Milgram (également connu pour ses expériences sur l'autorité) a montré qu'il était possible de relier tous les habitants de cette planète en passant environ par six intermédiaires. Depuis, l'idée a été reproduite dans de nombreux domaines, par exemple dans le cas du “jeu de Kevin Bacon“, qui consiste à se demander combien de connexions permettent de relier Kevin Bacon à n'importe quel autre acteur (il existe d'ailleurs une version avancée de ce jeu qui ne se limite pas à Kevin Bacon mais examine les relations entre deux comédiens pris au hasard).

Cette théorie des petits mondes est en train de devenir la nouvelle révolution scientifique à la mode, et on l'applique aujourd'hui tant à la physique qu'à la biologie ou à la sociologie, et bien sûr au web, la distance entre deux sites s'exprimant par le nombre de clics de souris nécessaires pour se rendre de la page de départ à celle d'arrivée. On ne s'étonnera donc pas qu'un certain Stephen Dohan l'ait appliqué aussi à Wikipedia, afin d'examiner les connexions reliant les différents articles.

L'idée en soi est excellente et prolonge les nombreux outils qui permettent déjà de documenter les évolutions de la plateforme. Elle pourrait permettre d'établir une cartographie des différents domaines de connaissance, de repérer des associations restées enfouies... Malheureusement, certaines idiosyncrasies de Wikipedia rendent ce projet difficile.

En théorie des réseaux, on appelle le “diamètre” la plus longue chaîne de connexions nécessaire pour unir deux éléments du réseau. Si le “diamètre” des relations humaines est d'environ 6, celui de Wikipedia, lui, tend à créer de la confusion: il est de 70 ! Mais ce chiffre ne signifie pas grand-chose, parce qu'il est le produit d'une série de 70 listes particulières, celles des astéroïdes du système solaire, organisées dans Wikipedia de telle manière qu'il faut parfois 70 clics pour aller d'une liste à une autre ! Si on corrige ce type d'aberration, en réalité, la “moyenne” des clics nécessaires pour se rendre d'un article à un autre est de 4,75.

L'autre question que s'est posée Stephen Dohan était la nature du “centre” de Wikipedia: c'est-à-dire l'article qui proposait le trajet le plus court vers tous les autres. Le vainqueur est “2007” qui est à 3,65 clics de n'importe quelle entrée de l'encyclopédie. Mais “2007″ est surtout une liste, ce qui le rend peu intéressant à analyser. Bizarrement le “vrai” centre de Wikipedia est “United Kingdom” avec une moyenne de 3,67 clics. Plus étrange encore, le second est Billie Jean King, une ancienne joueuse de tennis !

Sur la page de Dohan, on peut trouver un jeu “à la Kevin Bacon” qui permet de voir par soi même les connexions existantes entre deux articles. Ainsi nous apprenons qu'il n'existe que deux clics de distance entre Britney Spears et le philosophe Hegel, l'intermédiaire étant... la date du 14 novembre (mort du second, et vague référence à un article pour la première) !

Il semble donc qu'il reste du temps avant d'envisager une cartographie de Wikipedia comme un descriptif de la connaissance humaine. Pour ce faire, il faudrait exclure des calculs l'ensemble des articles qui pointent sur de trop nombreuses entrées sans apporter une contribution notable à leur signification (les dates, les pays, les lieux, sauf dans les articles spécifiquement historiques ou géographiques, bien sûr...).

Source: internetactu.net sous Licence Creative Commons by-nc

Aucun commentaire: