fonctionnement d'un moteur de recherche

Il y a une énorme quantité d'informations sur Internet (environ 50 millions de documents), et ces informations sont pour la plupart renouvellées quotidiennement. Le moteur de recherche est indispensable pour s'y retrouver!

Comment fonctionne un moteur de recherche?

Le moteur de recherche (Searchbot en anglais) est une machine spécifique (matérielle et logicielle) qui visite les sites, les indexe, les trie, afin que vous puissiez trouver les documents que vous cherchez.

Or des documents apparaissent et disparaissent tous les jours, il faut donc constamment réactualiser cette base de données. Ainsi, aucun moteur de recherche ne peut parcourir la totalité des pages en un jour (ce processus peut prendre plusieurs semaines). Chacun adopte donc sa propre stratégie, certains vont même jusqu'à calculer la fréquence de mise à jour des sites. Des robots (logiciels) parcourent des millions de pages Web, et associent l'adresse à des mots clés qui ont soit été définis en en-tête de la page, soit en piochant des mots dans la page.

Lorsque l'utilisateur d'un moteur remplit le formulaire, il spécifie les mots qu'il cherche (éventuellement ceux qu'il ne veut pas) grâce aux opérateurs booléens "et", "ou", "non" ... (symbolisés par +, -,...), la requête est envoyée au moteur qui consulte ses bases de données pour chacun des mots puis affine la recherche en enlevant les pages ne convenant pas, puis retourne une liste de liens vers des pages, avec le début du texte de la page ou le texte spécifié par le créateur de la page dans des balises spéciales, appelées méta-tags.

Ces réponses sont classées dans un ordre de pertinence, c'est-à-dire le pourcentage de mots correspondants à vos critères, et leur indice de densité (le nombre de fois que le moteur a trouvé un de vos mots clés dans la page).