mardi 11 novembre 2008

Au fait, ça marche comment un moteur de recherche ?

On les utilise souvent, on est impressionné par leurs capacités sans savoir comment ils fonctionnent. Un moteur de recherche a pour premier travail d'indexer le plus grand nombre de pages web. En clair, Voila, Excite, Google, Altavista et les autres récupérent sur la toile, des millions de pages. Pour cela, les moteurs utilisent des robots appelés des "spider" qui aspirent ces pages web sur ses ordinateurs.
Ainsi, lorsque vous faites une requête, le moteur va "fouiller" dans sa base, les pages qui correspondent aux mots-clés que vous avez entrés. Il ne trouvera donc que des pages qu'il a au préalable aspirées. Les moteurs sont lancés dans une course sans fin puisqu'il y a de plus en plus de sites sur le web, donc de plus en plus de pages à indexer.
On estime que les spider peuvent aspirer de 2 à 10 millions de pages par jour. L'opération demande des ressources matérielles énormes, ce qui explique que la mise à jour des moteurs ne soit effectuée qu'à intervalles de quelques jours, de quelques semaines voire plus.


Une recherche "en texte intégral"


En clair, les moteurs prennent en compte les mots contenus dans la page. Ceux placés dans les balises "titre", "description" et "mots-clés" et situés dans la partie invisible de la page entre et sont de moins en moins pris en compte bien que ces "tags" servent spécifiquement au référencement, donc à la visibilité des sites auprès des moteurs de recherche. Si les tags sont de plus en plus délaissés c'est pour contourner la triche.
En effet, des petits malins ont pris l'habitude de placer à cet endroit des mots qui n'ont rien à voir avec l'objet du site mais qui ont l'avantage d'être très recherchés par l'internaute. Ainsi si vous mettiez dans les balises des mots très populaires comme sexe, MP3 ou DivX, vous attiriez automatiquement sur votre site, un grand nombre d'internautes. C'est donc ce que vous pouviez espérer dans le passé, mais c'est de moins en moins vrai, au contraire, la pratique pourrait s'avérer rédhibitoire pour votre site.

Enfin, il faut aussi savoir que les moteurs ne se contentent pas de rechercher le mot seul mais ils prennent également en compte le contexte : plus le mot recherché est placé haut dans la page, plus la recherche est considérée comme pertinente, idem s'il est en gras, si son corps (taille) est important, s'il fait office de lien hypertexte...


Aucun commentaire: