Un sitemap XML est un fichier qui liste toutes les pages importantes d'un site web, aidant les moteurs de recherche et les crawlers IA à découvrir et indexer efficacement le contenu.
Qu'est-ce qu'un Sitemap XML ?
Un sitemap XML est un fichier au format XML qui répertorie les URLs de toutes les pages importantes d'un site web. Il fournit aux moteurs de recherche et aux crawlers IA une carte de votre site, facilitant la découverte et l'indexation de votre contenu.
Types de sitemaps
- Sitemap pages : Liste les pages principales du site
- Sitemap blog : Liste les articles de blog avec dates de publication et modification
- Sitemap images : Référence les images importantes
- Sitemap vidéo : Référence les contenus vidéo
- Sitemap index : Fichier maître qui pointe vers les sous-sitemaps
Pourquoi le Sitemap XML est important pour les IA ?
Les crawlers IA (GPTBot, ClaudeBot, PerplexityBot) utilisent les sitemaps de la même façon que Googlebot :
- Découverte de contenu : Les IA trouvent rapidement vos pages importantes
- Fraîcheur : La date de modification indique aux crawlers quand re-visiter une page
- Priorité : Vous pouvez indiquer quelles pages sont les plus importantes
- Exhaustivité : S'assurer que toutes les pages sont accessibles aux crawlers
Bonnes pratiques
- Déclarer le sitemap dans le fichier robots.txt
- Mettre à jour automatiquement le sitemap quand du contenu est ajouté
- Inclure uniquement les pages publiées et indexables
- Limiter à 50 000 URLs par fichier sitemap
- Soumettre le sitemap via Google Search Console et Bing Webmaster Tools
Sitemap XML et AI Labs Audit
Le Score GEO d'AI Labs Audit vérifie la présence et la validité de votre sitemap XML, et s'assure qu'il est correctement référencé dans votre robots.txt.