SEO : Comment indexer rapidement vos articles dans Google ?
Googlebot, le Robot d’indexation de Google est un robot numérique parcourant en permanence les pages des sites internet. Lorsqu’il découvre une nouvelle page,...
Filtrer par catégorie
Filtrer par auteur
Googlebot, le Robot d’indexation de Google est un robot numérique parcourant en permanence les pages des sites internet. Lorsqu’il découvre une nouvelle page,...
Publié par Elise Duret
Comprendre les stratégies de lecture des internautes va vous permettre de structurer et d’optimiser vos textes. Le comportement de lecture est spécifique sur...
Publié par Elise Duret
Google est le moteur de recherche n° 1, il parait indétrônable avec ses 92 % d’utilisateurs en France, suivi de loin par Bing 4 % et Yahoo...
Publié par Elise Duret
Le teasing publicitaire est une stratégie marketing qui peut s’avérer efficace… si elle est bien maîtrisée ! Par définition, le teasing est une méthode...
Publié par Elise Duret
Aujourd’hui, les cours en ligne ont le vent en poupe ! Les internautes sont friands de ces contenus d’E-learning, plus besoin de faire des kilomètres, la...
Publié par Elise Duret
Malgré la place prépondérante du numérique dans la stratégie de communication des entreprises, les panneaux publicitaires, ou billboards, n’ont pas dit leurs...
Publié par Elise Duret
Connaissez-vous la recette d’un bon texte en rédaction web ? Elle tient en quatre ingrédients : captivant, pertinent, clair et concis ! À moins...
Publié par Elise Duret
Le Doming, vous connaissez ? Cette technique importée des États-Unis consiste à transformer des logos sans reliefs en véritables objets 3D. Transportable...
Publié par Elise Duret
Que vous ayez besoin de créer un site web ou une application mobile, Photoshop reste une référence dans le domaine de l’UI Design. Mais connaissez-vous...
Publié par Elise Duret
Rédiger un texte pour une revue scientifique n’est pas chose aisée. La publication d’un article de recherche est soumise à des codes éditoriaux bien...
Publié par Elise Duret
Googlebot, le Robot d’indexation de Google est un robot numérique parcourant en permanence les pages des sites internet. Lorsqu’il découvre une nouvelle page, il en analyse le...
Googlebot, le Robot d’indexation de Google est un robot numérique parcourant en permanence les pages des sites internet. Lorsqu’il découvre une nouvelle page, il en analyse le contenu, et détecte les liens (internes et externes) qu’il y rencontre.
Il va suivre ses liens de page en page et stoppera son analyse lorsqu’il rencontrera une page d’erreur, ou ne contenant aucun lien. Googlebot visite, collecte et indexe les pages, et contrôle aussi le degré de vulnérabilité des pages en question.
Le robot de Google est enfin en mesure de vous donner des informations à propos des textes et sur le référencement naturel de votre site web. Son travail se décompose en 2 étapes.
Googlebot va commencer par visiter un site web, explorant son contenu, puis en suivant les différents liens qu’il y rencontrera. Il collecte cet ensemble de données et en retire le plus d’informations possible.
Évidemment, le robot de Google a une nette préférence pour les contenus originaux, et les sites web régulièrement alimentés en contenu récent sont la garantie de voir le crawler plus fréquemment.
En clair, plus votre site est alimenté en contenu, plus vos articles seront indexés rapidement : c’est un système basé sur le renouvellement continu des données.
L’ensemble des éléments ainsi collectés seront ajoutés à l’index de Google, qui depuis 2010 et le lancement de « caféine » arrive à enregistrer les nouvelles informations en très peu de temps.
Si Google stoppe son nombre de résultats à 25 270 000 000 (pour une recherche de type « e », ou « the » par exemple), le nombre de pages indexées dépasse de loin ce chiffre dont on estime qu’il serait de centaines de milliers de milliards.
Vous le savez, être indexé dans le moteur de recherche est très important. Faciliter le travail de GoogleBot est donc une bonne idée. Voici quelques erreurs fréquemment commises sur l’indexation de vos contenus.
Si vous avez une nouvelle page stratégique et importante à indexer le plus rapidement possible, vous pouvez indiquer son URL à Google. Il vous suffit d’aller dans votre espace Google Search Console et d’inspecter l’URL en question.
Votre site dispose d’un sitemap, n’est-ce pas ? C’est un fichier très utile qui guide les robots crawler à travers votre site. Au lieu d’attendre sagement que le Googlebot passe par là, vous pouvez adopter une démarche active, en soumettant votre sitemap, toujours grâce à la Google Search Console.
Avant toute autre chose, le robot d’un moteur de recherche va vérifier votre fichier robots.txt. Ce fichier indique aux robots des directives sur quels chemins d’URLs ils ont l’autorisation d’emprunter.
Ces directives ne sont pas toujours respectées : bien sûr, les crawlers de la plupart des moteurs de recherche vont obéir à ces instructions. Les crawlers hostiles, spambots, robots qui scannent les vulnérabilités ou encore des scrapers d’email n’en ont cure.
Vous pouvez valider votre fichier robots.txt dans le testeur robots.txt de de la Google Search Console. Sans ces directives, Googlebot agira « par défaut » : il va donc crawler et indexer tout ce qu’il trouvera, et vous gaspillerez votre précieux budget de crawl.
Le robot de Google dispose d’un quota d’un certain nombre de pages à crawler sur votre site. Cela s’appelle le « budget de crawl ». Vous pouvez le faire dans le fichier robots.txt qui insérera les balises « Meta » correspondantes sur ces pages.
Vous devez donc montrer à GoogleBot les pages à parcourir, mais aussi celles qu’il ne doit pas parcourir, comme :
Les paramètres d’URL (comme les balises UTM) peuvent également être problématiques et générer du contenu dupliqué, tout en gaspillant du budget de crawl.
Veillez à bien Ajouter un attribut de lien rel=canonical aux pages contenant des paramètres et assurez-vous que ceux-ci sont bien configurés dans votre Google Search Console.
Toute instruction utilisable dans une balise « Meta robots » grâce à votre robots.txt peut également être injectée côté serveur, comme élément de réponse dans l’en-tête HTTP avec la balise « X-Robots-Tag ».
Vous voilà prêts à vérifier et optimiser la gestion de vos robots, en vous assurant qu’ils indexent votre contenu le plus efficacement possible !
Abonnez-vous pour recevoir notre sélection des meilleurs articles directement dans votre boîte mail.
Nous ne partagerons pas votre adresse e-mail.
Découvrez les différentes facettes de cette profession, que vous débutiez votre carrière dans le numérique ou que vous ayez choisi de vous lancer dans un projet de reconversion...
Le Règlement Général sur la Protection des Données entre en vigueur aujourd’hui. Les entreprises qui traitent des données personnelles de...
Accueil / Archives de Elise Duret / Page 26