Un projet de moteur de recherche secoue la communauté Wikimedia

Un projet de moteur de recherche secoue la communauté Wikimedia

Shake it off comme dirait Taylor

Avatar de l'auteur
Guénaël Pépin

Publié dans

Internet

16/02/2016 10 minutes
9

Un projet de moteur de recherche secoue la communauté Wikimedia

La fondation Wikimedia a reçu 250 000 dollars de la part d'une autre fondation pour préparer un moteur de recherche lié à Wikipédia. Annoncé en janvier, le projet date en fait du début de l'an dernier et crée la controverse chez une partie des contributeurs, qui s'estiment peu informés des motivations et du développement.

Après avoir récemment fêté les 15 ans de Wikipedia (voir notre analyse), la fondation Wikimedia conçoit un nouveau moteur de recherche. Nommé Knowledge Engine, il est censé être spécialisé dans les contenus libres, qui pourrait aller au-delà des services soutenus de la galaxie Wikimedia. La première phase du projet est financée à hauteur de 250 000 dollars par la fondation Knight, qui s'est spécialisé dans la subvention de projets qui « promeuvent le journalisme de qualité, font avancer l'innovation dans les médias, engagent des communautés et favorisent les arts ».

Le financement de la fondation doit contribuer au projet jusqu'au 31 août 2016. Il doit contribuer à « faire émerger de nouveaux modèles de recherche d'information, en soutenant la première étape du développement du Knowledge Engine par Wikipédia, un système pour découvrir des informations publiques fiables et de confiance sur Internet » selon le site officiel de la fondation Knight.

Une première étape estimée à 2,5 millions de dollars

Les 250 000 dollars de la fondation Knight ont plusieurs objectifs précis, qui vont dans le sens d'une démarche transparente :

  • des tests utilisateurs et des études sur le parcours utilisateur dans la découverte de contenu
  • la création et la maintenance d'un tableau de bord de métriques principaux pour le développement produit
  • l'étude de la pertinence en recherche et la possibilité d'intégrer des sources de données ouvertes
  • une discussion ouverte avec la communauté des éditeurs de Wikimedia
  • la création de prototypes pour présenter les possibilités de découverte

Le but affiché est donc d'améliorer les méthodes de recherche dont dispose Wikipédia et d'en faire profiter la communauté, en l'impliquant au mieux dans le processus. Le plan de la première année est d'ailleurs précis.

Wikimedia Knowledge Engine roadmap
Crédits : Wikimédia

Pourtant, malgré le nombre d'occurrences du mot « ouvert » dans les documents, la démarche est restée un bon moment loin des yeux de la communauté. Accordée en septembre, cette subvention n'a été révélée que début janvier et le document de l'accord n'est sorti qu'en fin de semaine dernière, après des mois d'interrogations au sein des contributeurs de la fondation.

Comme l'a relevé The Register vendredi, ces 250 000 dollars ne sont que la première étape du projet, dont le coût est tout de même estimé à 2,5 millions de dollars. La somme peut paraître importante, mais elle semble raisonnable en comparaison de celle initialement prévue et des chamboulements qu'implique ce projet. De même, une partie de la communauté soupçonne Wikimedia de voir plus loin que la recherche spécialisée, pour aller sur le terrain des moteurs généralistes.

Un nouveau département créé sans préavis

Le premier contact des membres de Wikimedia avec ce projet a été la création d'un nouveau département « Search and Discovery » en avril 2015. Certains contributeurs se sont ainsi interrogés de l'intérêt de cette nouveauté et des moyens qui lui sont alloués, alors qu'aucun projet n'était encore annoncé.

« Search and Discovery, une nouvelle équipe, semble être extraordinairement bien dotée en personnel avec un nombre disproportionné d'ingénieurs, quand d'autres domaines semblent les vouloir » s'étonnait la wikipédienne Anne Clin en mai. Selon elle, le plan financier pour 2015-2016 de la fondation ne mentionnait pas spécifiquement d'amélioration de la recherche. « Plus d'explications sur la raison pour laquelle Search and Discovery est soudainement devenu un objectif aussi majeur sont requises, pour savoir si c'est une allocation pertinente des ressources » estime-t-elle.

Le projet aurait concrètement débuté en juin, même s'il n'a été officiellement révélé que six mois plus tard. Selon James Heilman, un ancien membre du conseil d'administration, limogé en décembre, ce projet a été développé avant avril et présenté à des investisseurs avant de l'être à la communauté. Il affirme par ailleurs avoir été d'abord opposé à cette subvention, et que cette opposition serait l'une des raisons de son départ précipité.

« Quand j'ai découvert la subvention et les négociations qui y ont mené, j'ai pris la position apparemment controversée que la communauté devait être impliquée tôt dans le processus d'un projet nouveau et semble-t-il étendu. Par étendu j'entends que les coûts étaient estimés dans la dizaine de millions de dollars et que cela semblait impliquer la création d'un nouveau site » a-t-il expliqué dans un message mis en ligne dimanche. Cette éviction même, pour « défaut de confiance », est un point polémique au sein de la communauté.

Un moteur de recherche de contenus libres ?

Malgré une annonce début janvier, c'est donc ce mois-ci que les informations sur le projet et son déroulement ont été vraiment compilées. C'est Andreas Kolbe, un wikimédien de longue date, qui s'est attelé à la tâche pour Wikipedia Signpost le 3 février.

Au fond, ce qui interroge la communauté sont les intentions même de la direction de Wikimedia avec ce projet. Jimmy Walles, le fondateur de Wikipédia, nie toute velléité de « créer un Google ». La FAQ de Discovery réitère la distinction : « Nous ne construisons pas de Google. Nous améliorons l'infrastructure CirrusSearch existante avec une recherche plus pertinente, multilingue et multi-projets, tout en incorporant de nouvelles sources de données pour nos projets ». Pour rappel, CirrusSearch est l'extension moteur de recherche de MediaWiki, le logiciel utilisé pour Wikipédia.

Il ne s'agirait donc que d'améliorer la recherche, en la rendant plus accessible. Pourtant, des documents suggèrent une direction qui s'en rapproche. Une présentation, datée de novembre, montre ainsi plusieurs pistes pour le projet. Certaines rapprochent une future page d'accueil de Wikipedia de celle de Google, centrée sur une barre de recherche. S'il ne s'agit que d'une piste, cette nouvelle importance de la recherche dans les maquettes interroge les observateurs.

Wikimedia Knowledge Engine pistes
Crédits : Wikimedia

 

De même, la fondation oppose directement sa démarche « ouverte » à l'enfermement des systèmes et moteurs de recherche actuels, type Google. Face à des moteurs intrusifs, aux rouages et à la collecte de données obscurs, Wikimédia propose comme « solution » une curation publique des contenus, la transparence et le respect de la vie privée.

Un projet aux contours flous

Dans les faits, la fondation Wikimedia prévoit une feuille de route sur trois ans, selon le document daté de novembre. Comme convenu avec la fondation Knight, la première année doit avant tout être une année d'étude. Les deuxième et troisième années correspondent, elles, à la conception et au perfectionnement du modèle de curation, en intégrant la communauté.

D'autres projets en cours de la fondation sont aussi impliqués, comme Wikidata. Ce système doit permettre de « sémantiser » les données de base des fiches Wikipédia pour améliorer leur traitement et modification, par exemple en indiquant simplement des dates d'évènements sur toutes les versions de l'encyclopédie à partir d'un point unique.

Le moteur doit à la fois intégrer les contenus des sites Wikimedia mais aussi d'autres sources. « Nous prévoyons de chercher activement des retours sur notre API et étendre la participation de nombreuses sources de savoir tierces au sein de notre moteur » explique le document de novembre. L'idée est donc de collaborer directement avec des tiers dans le monde du savoir libre, en « promouvant les sources de savoir ouvertes pour renforcer la légitimité de notre contenu ». Des projets tiers comme OpenStreetMap sont ainsi évoqués.

Pour soutenir ce projet, Wikimedia a d'abord demandé deux millions de dollars de financement à Knight, tablant sur plus de six millions de dollars d'investissement d'ici 2018. Cela à comparer aux 2,5 millions prévus pour cette première année. En ayant reçu 250 000 pour le moment, il n'est pas encore dit où la fondation ira chercher les financements manquants si le projet perdure.

Un autre aspect de la subvention par la fondation Knight interroge. Les 250 000 dollars alloués doivent aussi contribuer à répondre à des questions précises. Parmi elles, la fondation demande si les utilisateurs iraient sur Wikipédia si c'était « un canal ouvert au-delà de l'encyclopédie » qu'elle est actuellement. De même, la fondation Knight s'interroge sur la possibilité d'intégrer Wikipédia dans les terminaux mobiles via les opérateurs et fabricants. Autant d'éléments qui jettent un grand flou sur les intentions réelles de Wikimédia.

Une communauté qui s'estime exclue du projet

Pour Andreas Kobe, le membre de la communauté Wikimedia qui a enquêté sur le sujet, cette révélation est « une petite bombe » pour les contributeurs. « Ils étaient amenés à croire qu'il s'agissait d'avoir une fonction de recherche centralisée pour tous les contenus éparpillés sur les sites Wikimedia, avec peut-être OpenStreetMap en sus... Les contributeurs sentent que la fondation les a volontairement laissés hors de la boucle » estime-t-il, interrogé par The Register.

L'un des principaux problèmes est donc que, de la création du département Search and Discovery à l'accord sur la subvention, la direction de Wikimedia a prévenu la communauté à rebours, publiant les documents après des demandes répétées de certains membres. 

La communauté s'interroge donc sur ce projet, estimant n'avoir été que très peu informée. La subvention a été annoncée au public le 6 janvier dernier, des mois après que la polémique autour du projet a pris de l'ampleur. Le conseil d'administration aurait été réticent à fournir les lettres de demande et d'accord liées à cette subvention, qui ont finalement été publiées ces dernières semaines. L'une des raisons avancées est le risque juridique de dévoiler certains points, qui semble habituel lors de la publication de documents liés aux subventions.

La pression populaire a obligé la direction de Wikimedia a plus de transparence, alors que le projet lui-même stipule qu'elle devait être impliquée. Les derniers documents sortis montrent aussi un décalage important entre ce qui a été présenté du projet et ce qui est prévu. Le flou reste sur certains points, comme l'intégration à Wikipédia lui-même ou la création d'un nouveau site. Reste donc à voir comment les relations autour de ce projet évolueront, notamment fin août, à la fin de la période définie avec la fondation Knight pour sa première étape.

Écrit par Guénaël Pépin

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Une première étape estimée à 2,5 millions de dollars

Un nouveau département créé sans préavis

Un moteur de recherche de contenus libres ?

Un projet aux contours flous

Une communauté qui s'estime exclue du projet

Fermer

Commentaires (9)


Breaking News: Un projet dans un regroupement comportement des dizaines de milliers de collaborateurs ne fait pas consensus.



((Un commentaire si con pour un article si bien écrit, je suis désolé))








von-block a écrit :



Breaking News: Un projet dans un regroupement comportement des dizaines de milliers de collaborateurs ne fait pas consensus.



((Un commentaire si con pour un article si bien écrit, je suis désolé))







eh ouais t’as pas le niveau s’tout :o









von-block a écrit :



Breaking News: Un projet dans un regroupement comportement des dizaines de milliers de collaborateurs ne fait pas consensus.



((Un commentaire si con pour un article si bien écrit, je suis désolé))





Ton sous-titre est trop long…



Déjà qu’a deux c’est pas toujours gagné… Boarf, si en fait, ça marche si tu réponds “oui, d’accord, chérie”&nbsp;<img data-src=" />



Comme toujours : connaîtrons nous les sources du moteurs ? collecte de données ? roaming ? qui se chargera de la maintenance ? bref à étudier de très près.


Fondation Knight ? KITT sera bien plus cultivé que ce que la série montrait…



<img data-src=" />


La montre connectée et Siri avant l’heure <img data-src=" />



Sinon, le projet ne me semble pas si mauvais. Un “google” du contenu libre, ça serait pas mal ! Je comprends la réaction de certains, qui sont peut être trop impliqués, mais de mon point de vue d’utilisateur lambda, je préfère que le projet avance sans qu’on demande son avis à chacun, c’est le meilleur moyen de ne rien faire <img data-src=" />*



Nous jugerons sur pièce… En tout cas j’espère que le budget est suffisant, sinon on n’a pas fini de manger du bandeau “1 euro pour manger et payer ma bande passante” !








boogieplayer a écrit :



Déjà qu’a deux c’est pas toujours gagné…





Même avec deux humains sur terre, tu auras trois opinions <img data-src=" />



:oui2:








Jarodd a écrit :



La montre connectée et Siri avant l’heure <img data-src=" />



Sinon, le projet ne me semble pas si mauvais. Un “google” du contenu libre, ça serait pas mal ! Je comprends la réaction de certains, qui sont peut être trop impliqués, mais de mon point de vue d’utilisateur lambda, je préfère que le projet avance sans qu’on demande son avis à chacun, c’est le meilleur moyen de ne rien faire <img data-src=" />*



Nous jugerons sur pièce… En tout cas j’espère que le budget est suffisant, sinon on n’a pas fini de manger du bandeau “1 euro pour manger et payer ma bande passante” !







+1.



Un moteur de recherche dédié au contenu libre, ça a son intérêt. Surtout parce qu’avec ça, il n’y aura pas que Google sur le net.



A suivre donc.