Un moteur de recherche est un programme conçu pour faire des recherches dans des bases de données.
Pour le ‘client’, un moteur de recherche est un site internet servant à trouver des adresses d’autres sites internet. Attention de ne pas confondre avec les annuaires de sites, qui eux classent les adresses de site dans des répertoires liés à leurs secteurs d’activités. Le fonctionnement est totalement différent.
Les véritables moteurs de recherche collectent les informations sur les sites web avec des robots (autrement appelé spiders ou crawlers). Chaque moteur de recherche a son propre algorithme pour indexer les sites web et lister les pages internet.
Un algorithme est un code qui permet de réaliser des traitements complexes, grâce à une suite d’opérations, d’instructions ou de conditions. Un algorithme de moteur de recherche est de nos jours excessivement complexe. Pourtant il doit être performant, pertinent et personnalisé, afin de traiter une demande et d’apporter, un classement des sites les plus intéressants pour chacune des requêtes.

Voici les principaux :

 

Comment fonctionne-t-il ?

Le fonctionnement d’un moteur de recherche se décompose en trois processus principaux :

  1. L’exploration (ou crawl) : la toile du web est constamment explorée par une
    multitude de robots d’indexation (spiders) suivant chaque lien hypertexte qu’ils trouvent.
    Ils identifient les informations considérées comme intéressantes sur chaque page.
    Lorsqu’un robot (ou bot) parcourt une page web, il laisse une trace de sa visite. On peut ainsi identifier le passage d’un robot avec sa signature, par exemple le crawler de Google signe Googlebot.
  2. L’indexation des informations récupérées consiste à extraire les données considérées comme significatives de l’ensemble de la page. Les mots extraits sont insérés dans une base de données, sa structure est très complexe. Elle met en corrélation des informations pour attribuer aux mots stockés des notions de poids qui détermine l’importance de chaque mot dans le site.
  3. La recherche correspond aux requêtes que le moteur de recherche effectue pour obtenir ses résultats. C’est à ce moment que l’algorithme de recherche est appliqué, pour identifier les sites internet qui correspondent le mieux aux termes contenus dans la requête de l’utilisateur, afin de présenter une liste de résultats de la recherche par ordre de pertinence.
    Le résultat s’affiche sur une page du moteur de recherche, cette page est appelée SERP (Search Engine Results Page – Page de résultats du moteur de recherche). On y retrouvera les informations de chaque site web sélectionné (un titre, une description du site, un lien sur celui-ci et bien d’autres informations).
580 View

Leave a Comment