La récente mise à jour de la documentation de Google sur les crawlers suscite un intérêt croissant. Tout au long de cette refonte, Google a cherché à améliorer l’accès à des informations techniques peu accessibles. Trois nouvelles pages ont été créées afin de faciliter la compréhension. Que vous soyez un expert du SEO ou un gestionnaire de site, il est crucial de comprendre ces changements et comment ils peuvent affecter le référencement de votre site.
Nouvelle organisation de la documentation
La première chose à noter est la réorganisation complète de l’ancienne page d’« Aperçu des crawlers ». Google a décidé de diviser cette page en trois sections distinctes :
- Crawlers courants : Qui englobe les bots utilisés pour l’exploration générale, comme Googlebot.
- Crawlers à usage spécifique : Ici sont regroupés les crawlers utilisés pour des produits spécifiques, par exemple AdsBot pour les services publicitaires.
- Fetchers déclenchés par les utilisateurs : Ces bots sont initiés par des actions utilisateur, tels que Google Site Verifier.
Cette nouvelle structure permet une navigation plus fluide dans la documentation, chacun des types pouvant désormais être exploré plus en profondeur.

Impact de la réorganisation
Avant cette mise à jour, la page d’aperçu était trop chargée et manquait de clarté. Les utilisateurs peinaient à trouver les informations spécifiques dont ils avaient besoin. Ce changement répond à un besoin croissant de clarté, surtout dans un monde où chaque seconde compte pour les gestionnaires de site.
Désormais, les responsables SEO et autres professionnels peuvent facilement consulter les sections requises, ce qui facilite aussi l’intégration de nouvelles informations à l’avenir sans alourdir la structure. Ce modèle modulaire est essentiel pour envisager des mises à jour fréquentes, à mesure que les technologies évoluent et que de nouveaux crawlers apparaissent.
Nouvelles sections ajoutées
Parmi les évolutions notables, Google a introduit une section plus détaillée sur les propriétés techniques des crawlers. Cette section aborde des sujets comme les types d’encodage supportés, ce qui constitue un apport précieux pour les gestionnaires de sites. Connaître les détails techniques aide à affiner la réponse des serveurs aux requêtes des crawlers.
De plus, des encodages comme gzip, deflate et Brotli sont désormais documentés. Alors qu’auparavant, aucune mention spécifique n’était fournie dans l’ancienne documentation, avoir accès à ces informations permet de mieux adapter votre contenu et de garantir son accessibilité.

Importance de l’encodage pour les crawlers
S’assurer que votre contenu est bien encodé en fonction des standards acceptés par les crawlers de Google est désormais plus essentiel que jamais. Les encodages jouent un rôle crucial dans la vitesse et la manière dont un site est exploré. Reprendre les bonnes pratiques d’encodage peut améliorer le temps de chargement et réduire le taux de rebond, éléments essentiels pour le référencement naturel.
Par exemple, en mettant en place un encodage gzip sur vos pages, vous vous assurez qu’elles chargent efficacement. Google a même mentionné que ces encodages sont indiqués dans les en-têtes des requêtes. Cela signifie que vous devez être conscient de vos réponses HTTP pour bénéficier pleinement de cet aspect technique.
Mise à jour des chaînes User-Agent
Google a également pris le temps de mettre à jour ses chaînes User-Agent. Ceci est une information cruciale pour ceux qui pratiquent le suivi à l’aide de ces chaînes, car cela aide à identifier quels crawlers explorent votre site. Avec l’ajout de nouveaux bots comme GoogleProducer, il est vital que les webmasters soient à jour concernant ces mises à jour.
Cette mise à jour facilite le travail de détection pour les outils d’analyse, car chaque bot a sa propre chaîne, permettant une analyse plus granulaire des interactions entre votre site et les différentes entités de Google.

La nécessité d’un suivi adéquat
Maintenir un suivi adéquat de ces User-Agent est fondamental. L’examen des journaux de votre serveur vous permettra d’identifier quels crawlers accèdent à votre site et s’il existe des problèmes d’exploration. En évaluant cette donnée, on peut par la suite alimenter des améliorations techniques pour optimiser le passage des crawlers sur votre domaine.
Une bonne pratique consisterait à établir des alertes pour les chaînes User-Agent spécifiques qui pourraient signaler des comportements anormaux, ou encore mettre en place un fichier robots.txt bien élaboré pour guider ces robots d’une manière adéquate.
Utilisation de HTTP/2 pour le crawling
Une autre addition importante à la documentation est la mention de l’utilisation de HTTP/2 pour les requêtes de crawl. Jusqu’à maintenant, la documentation indiquait que Google utilisait le protocole HTTP/1.1. Avec l’évolution des temps de chargement et des performances des pages, cette mise à jour s’avère essentielle.
HTTP/2 est un protocole qui offre des améliorations significatives par rapport à son prédécesseur, notamment en réduisant la latence et en permettant plusieurs requêtes en parallèle. Cela signifie que les sites bien configurés sur ce protocole pourront potentiellement recevoir une exploration plus efficace et rapide par Google.

Les bénéfices de rester à jour
Être à jour avec la technologie HTTP est maintenant fondamental. Ignorer cette mise à jour peut entraîner des problèmes dans votre référencement naturel. Les pages qui ne chargent pas rapidement ou qui présentent des problèmes d’encodage sont souvent mal indexées. Concernant les crawlers, ils privilégient les sites offrant une meilleure expérience utilisateur à travers des temps de chargement rapides.
Il est donc recommandé d’évaluer votre infrastructure serveur et votre configuration pour profiter pleinement des fonctionnalités modernes d’HTTP/2 et ainsi, optimiser vos chances d’être favorablement indexé.
Préparation pour l’avenir
La refonte de la documentation sur les crawlers de Google est bien plus qu’une simple réorganisation. Elle anticipe également l’avenir en permettant une mise à jour plus aisée des informations techniques. L’introduction de sections et de sous-sections spécifiques favorise l’intégration de nouvelles données, des améliorations continues et un accès prolongé à l’information.
Cette capacité d’adaptation est essentielle alors que le paysage du web continue d’évoluer, avec une diversité croissante des technologies et des pratiques SEO en émergence. L’importance de rester informé et de comprendre ces nuances ne doit pas être sous-estimée.

Les nouvelles opportunités pour les professionnels du SEO
Ce changement ouvre la porte à de nouvelles pratiques et opportunités pour les professionnels du SEO. Le développement des connaissances autour des crawlers et leur fonctionnement peut donner un avantage dans la mise en place des stratégies d’optimisation. En comprenant mieux comment les crawlers fonctionnent, les experts peuvent affiner leurs pratiques. Cela peut aller de l’optimisation des temps de chargement à l’implémentation de bonnes pratiques pour paroles essentielles dans le domaine du SEO.
Pour rester compétitifs, il est conseillé de se former régulièrement, d’échanger sur les meilleures pratiques et de rester à l’affût des nouvelles technologies, en prenant en compte les mises à jour de la documentation de Google.

