19 mars 2006

Premiers referencements: Google, Yahoo

Notre site web ne comporte pour l'instant qu'une seule page... mais c'est suffisant pour commencer à le faire référencer dans les moteurs de recherche (mais pas dans les annuaires). Et comme ce processus de référencement peut être assez long... autant le commencer tout de suite pour que, lorsque le site sera prêt, nous n'ayoons pas encore à attendre plusieurs semaines.

Moteur de recherche? Annuaire?
Un moteur de recherche dispose de deux mécanismes: un programme "robot" qui explore en permanence les pages du Web et en indexe le contenu, et un module de recherche qui répond aux questions et recherches qu'on lui soumet, cherchant les réponses dans les pages indexées qu'il a gardées en mémoire.
Le robot, parfois appelé aussi "araignée" puisqu'il parcourt la Toile (le Web) part d'une adresse de page qu'on lui donne, par exemple http://humourhistoires.free.fr . Il va "lire" cette page, en explorer les textes, et les séparer schématiquement en 4 catégories:
  • les liens vers d'autres pages -qui fourniront ultérieurement d'autres pistes d'exploration pour l'araignée,
  • le texte de la page, les paragraphes, phrases et mots qui la constituent -le contenu qui va être indexé,
  • les méta-indicateurs, qui fournissent des informations à propos de la page -celles qui nous importent ici sont les informations de description de la page, description écrite par l'auteur de la page, ainsi que les informations de mots-clés (keywords), sélection descriptive là encore écrite par l'auteur de la page,
  • le reste des caractères, qui est ignoré en quasi-totalité par les moteurs de recherche -il s'agit notamment des balises html qui décrivent la présentation de la page et de son contenu.

Les contenus indexés de chaque page sont donc conservés, et ils constituent la base des informations qu'interroge le moteur pour répondre aux questions qui lui sont posées.

Lorsque je crée un nouveau site, initialement je suis quasiment le seul à savoir qu'il existe: il est donc peu probable qu'une "araignée" l'explore et en indexe le contenu. Certains pensent qu'actuellement il y a ainsi un tiers du web "inconnu", c'est-à-dire qui n'est référencé dans aucun moteur de recherche et que donc son contenu ne peut être accédé que par ceux qui en connaissent l'adresse exacte. Et donc, pour mettre tous les atouts de mon côté, je vais indiquer aux moteurs de recherche l'existence de mon site, par exemple en donnant l'adresse d'une page d'où l'on peut accéder à toutes les autres pages de mon site en les explorant.

Un robot de recherche indexe seul le contenu des pages web qu'il connaît ou découvre lors de ses explorations. Au contraire, un annuaire est une liste "manuelle" de sites et de leurs descriptions. Pour les plus grands annuaires (celui de Yahoo, celui de DMOZ, de Voila ou encore de Google), l'inscription n'est pas automatique et sera vérifiée par une personne de l'annuaire: on va vérifier si la description proposée pour le site est exacte, si le site classé dans la bonne catégorie, etc.

Stratégie de référencement
Comment aborder le mieux possible le référencement, c'est-à-dire la façon dont les robots de recherche et les annuaires connaîtront le site?

  • Robots de recherche: tout de suite! Dès que le site comporte une ou plusieurs pages, il est important de les fournir aux robots de recherche: au moment de l'inscription, ils vérifieront si la page existe, mais dans la plupart des cas ils ne l'indexeront pas tout de suite, ils se contenteront de la mettre "à la fin de la liste" des pages à explorer. La plupart des robots mettent 4 à 8 semaines pour explorer toutes les pages qu'ils connaissent, c'est-à-dire "leur" web (qui est donc différent pour Google, Yahoo, etc). Donc, si aujourd'hui je propose une ou plusieurs pages de mon site, elles ne seront explorées que dans un mois... et même alors il n'est pas certain que le robot indexera toutes les pages du site.
  • Annuaires: attention à la qualité! Si l'inscription de notre site doit être validée par une personne après exploration de son contenu... il est urgent d'attendre que le contenu soit significatif, qu'il y ait plusieurs pages qui montrent que ce site présente de bon contenu. Donc, nous ne présenterons notre site que lorsqu'il comportera soit toutes ses pages, soit au moins une dizaine de pages qui en montreront le contenu.

Les premiers moteurs de recherche
Nous allons aujourd'hui soumettre notre site (une page!) à Google et à d'autres moteurs de recherche. Idéalement, il faudrait faire cela manuellement moteur par moteur. Pour notre exemple, nous utiliserons une autre solution, par laquelle un programme ira soumettre l'adresse de notre site à divers moteurs. Le programme que nous utilisons est celui de Submit Express, et les écrans s'y enchaînent ainsi:

Il suffit de taper l'adresse du site (en incluant bien http://), puis de cliquer le bouton "Continue"

Libellés : , ,

1 Commentaires:

Blogger intervalblonde a écrit...

Merci infiniment pour cette clarté sans égal. Dur de débuter, je continue donc de lire ton journal (celui qui n'a même pas de fautes : ah c'est plaisant !)

12:28  

Enregistrer un commentaire

Blogger un lien vers ce texte:

Créer un lien

<< Home