Battu à plate couture par Google et Yahoo sur le terrain de la recherche en ligne, Microsoft aurait dans les cartons une arme de poids pour améliorer la pertinence et l'efficacité de son service Live Search : un algorithme baptisé "Browserank", qui serait capable de déterminer l'importance d'une page Web, et donc la place qu'elle devrait occuper dans les résultats d'une recherche donnée, en fonction du comportement des internautes. Microsoft signera-t-il la fin du Pagerank ?
Numéro un mondial de la recherche en ligne, Google doit une partie de son succès à un algorithme baptisé Pagerank, qui permet de classer les pages Web affichées en tant que résultats d'une recherche, en fonction de leur importance relative. A chaque page correspond une note, sur dix, qui, pour simplifier, dépend de trois critères : le nombre de liens externes pointant vers la page cible, la note des pages dont partent ces liens, ainsi que le nombre de liens partant de la page cible vers le reste du Web.
Inventé par Larry Page, le concept de Pagerank a depuis sa création largement évolué, et la "note" conférée par Google à une page Web se voit maintenant pondérée par de nombreux critères, à commencer par la proximité sémantique entre les différentes pages qui se lient les unes les autres.
Selon les chercheurs du centre Microsoft Research Asia en charge du développement du Browserank, il manque aux algorithmes actuellement en vigueur une dimension essentielle : la prise en compte du comportement des internautes, qui se révèlerait selon eux le meilleur indicateur de la pertinence d'une page Web. Si l'internaute passe longtemps sur une page, c'est que celle-ci a de bonnes chances de répondre à sa requête, exposent-ils. De la même façon, plus une page est visitée, et plus elle est susceptible de revêtir un intérêt. Ces mesures doivent toutefois être pondérées par de nombreux critères, à commencer par la taille et le poids d'une page : plus celle-ci est volumineuse, et plus les internautes sont susceptibles d'y passer du temps, etc.
Partant de ce postulat, les chercheurs de Microsoft travaillent à l'élaboration d'un algorithme qui serait capable d'automatiser le traitement de données statistiques en provenance des d'internautes de façon à déterminer dans quel ordre les résultats devraient être affichés lors d'une recherche sur Internet (voir ce document PDF, en anglais).
Pour que l'analyse soit efficace, il faut travailler sur un échantillon représentatif de la population Web mondiale, soit plusieurs millions d'internautes. Pour ce faire, Microsoft suggèrerait d'exploiter les données qui sont remontées aux éditeurs par les différentes "barres" proposées comme extensions à nos navigateurs Web. "Toutes les informations relatives à la vie privée de l'utilisateur sont rigoureusement filtrées", préviennent d'emblée les chercheurs en charge de ce projet, sentant poindre l'inévitable vindicte des hérauts de la confidentialité des données personnelles.
A l'heure où les éditeurs de sites Web usent et abusent des techniques connues permettant d'améliorer artificiellement leur position dans les moteurs de recherche, conférer une telle importance au comportement de l'internaute permettrait sans doute de remettre de l'ordre dans cette entreprise délicate qu'est le SEO, ou Search Engine Optimisation. Google a d'ailleurs déjà commencé à prendre en compte ces données : sur une page de résultats données, les liens les plus cliqués ont de bonnes chances de voir leur positionnement amélioré, afin de refléter les choix de l'internaute.
Numéro un mondial de la recherche en ligne, Google doit une partie de son succès à un algorithme baptisé Pagerank, qui permet de classer les pages Web affichées en tant que résultats d'une recherche, en fonction de leur importance relative. A chaque page correspond une note, sur dix, qui, pour simplifier, dépend de trois critères : le nombre de liens externes pointant vers la page cible, la note des pages dont partent ces liens, ainsi que le nombre de liens partant de la page cible vers le reste du Web.
Inventé par Larry Page, le concept de Pagerank a depuis sa création largement évolué, et la "note" conférée par Google à une page Web se voit maintenant pondérée par de nombreux critères, à commencer par la proximité sémantique entre les différentes pages qui se lient les unes les autres.
Selon les chercheurs du centre Microsoft Research Asia en charge du développement du Browserank, il manque aux algorithmes actuellement en vigueur une dimension essentielle : la prise en compte du comportement des internautes, qui se révèlerait selon eux le meilleur indicateur de la pertinence d'une page Web. Si l'internaute passe longtemps sur une page, c'est que celle-ci a de bonnes chances de répondre à sa requête, exposent-ils. De la même façon, plus une page est visitée, et plus elle est susceptible de revêtir un intérêt. Ces mesures doivent toutefois être pondérées par de nombreux critères, à commencer par la taille et le poids d'une page : plus celle-ci est volumineuse, et plus les internautes sont susceptibles d'y passer du temps, etc.
Partant de ce postulat, les chercheurs de Microsoft travaillent à l'élaboration d'un algorithme qui serait capable d'automatiser le traitement de données statistiques en provenance des d'internautes de façon à déterminer dans quel ordre les résultats devraient être affichés lors d'une recherche sur Internet (voir ce document PDF, en anglais).
Pour que l'analyse soit efficace, il faut travailler sur un échantillon représentatif de la population Web mondiale, soit plusieurs millions d'internautes. Pour ce faire, Microsoft suggèrerait d'exploiter les données qui sont remontées aux éditeurs par les différentes "barres" proposées comme extensions à nos navigateurs Web. "Toutes les informations relatives à la vie privée de l'utilisateur sont rigoureusement filtrées", préviennent d'emblée les chercheurs en charge de ce projet, sentant poindre l'inévitable vindicte des hérauts de la confidentialité des données personnelles.
A l'heure où les éditeurs de sites Web usent et abusent des techniques connues permettant d'améliorer artificiellement leur position dans les moteurs de recherche, conférer une telle importance au comportement de l'internaute permettrait sans doute de remettre de l'ordre dans cette entreprise délicate qu'est le SEO, ou Search Engine Optimisation. Google a d'ailleurs déjà commencé à prendre en compte ces données : sur une page de résultats données, les liens les plus cliqués ont de bonnes chances de voir leur positionnement amélioré, afin de refléter les choix de l'internaute.
-
Auteur
-
Origine