Microsoft rachète Powerset et sa recherche sémantique

Le futur de la recherche sur le web en filigrane 17
La recherche sur le web, sous toutes ses formes, est la clé de l’accès à l’information aujourd’hui. Au-delà des simples mots-clés habituels, c'est désormais la sémantique qui représente l'avenir.

microsoft researchLes antipodes du naturel en informatique

La sémantique renvoie au sens des mots. Lorsqu’elle est appliquée, en théorie du moins, à un moteur de recherche, celui-ci est alors capable de comprendre où l’utilisateur souhaite en venir. Les mots appartiennent à des familles et peuvent être regroupés selon de nombreux critères. Si le moteur de recherche peut comprendre ces critères et procéder à des regroupements, les résultats offerts gagneront largement en précision, sans même parler de la possibilité d’utiliser le langage naturel.

Les antipodes du naturel en informatique

Evidemment, la sémantique est techniquement un véritable défi. Satya Nadella, vice-président de la recherche chez Microsoft, résume la situation : « Les moteurs de recherche sont incapables aujourd'hui de comprendre que les mots arbuste et arbre renvoient à un même concept. On ne comprend pas pourquoi la requête sur le mot cancer renvoie tantôt à l'horoscope, tantôt à la maladie, et comment une recherche ou une page web font référence à l'un ou à l'autre ». Selon Satya Nadella toujours, « un tiers des recherches n'obtiennent pas de réponse adéquate lors de la première recherche et au premier clic ». Une part très importante qu’il faut donc baisser.

L'arrivée de Powerset chez Microsoft...

Intégrer la sémantique dans les capacités d’un moteur de recherche demande à la fois des développeurs et donc un niveau technique important, mais également des spécialistes de la linguistique capables de tracer la voie à suivre. On sait que Microsoft, lorsque le besoin de s’étendre dans un domaine se fait sentir, a souvent tendance à racheter une société pour se lancer. Aujourd’hui encore, c’est le cas, avec la confirmation du rachat de la société Powerset, spécialisée justement dans la sémantique appliquée aux recherches sur Internet.

powerset

Comme le montre la capture, Powerset affiche des résultats qui présentent des caractéristiques intéressantes :
  • Chaque lien de résultat offre un condensé des informations qu’on peut trouver sur chaque résultat
  • Selon la question, les réponses sont agrémentées d’informations trouvées sur Wikipedia, en rapport direct avec le sujet principal (exemple)
  • Quand cela est possible, les résultats sont accompagnés de médias complémentaires. Une recherche sur les bâtiments conçus par Jean Nouvel par exemple.
powerset

Mark Johnson, responsable produit de Powerset, a indiqué sur le blog officiel de l’entreprise plusieurs éléments importants de ce rachat. Certes la somme n’est pas connue, Microsoft n’ayant pas souhaité communiquer sur le sujet pour le moment, mais on sait par exemple que l’entreprise continuera de fonctionner en l’état. Ses locaux resteront les mêmes, à San Francisco. De même, les employés resteront en place.

Il y aura bien sûr un temps nécessaire à l’incorporation du travail réalisé par Powerset dans les produits concernés chez Microsoft, et en tout premier Live Search. Les deux buts principaux pour l’éditeur de Redmond sont d’augmenter de manière drastique la précision des résultats et la prise en charge du langage naturel, pour poser de véritables questions ou exposer un problème en une phrase simple.