Sitemaps XML

Le protocole Sitemaps permet aux webmaster d'indiquer d'une manière simple et claire les pages d'un site web qui doivent être explorées par les robots des moteurs de recherche comme Google, Yahoo! ou Bing.

Dans sa forme la plus simple et courante, un sitemap est un fichier au format XML généralement nommé sitemap.xml qui liste l'ensemble des URL d'un site ainsi que des métadonnées facultatives complémentaires qui pourraient leur être associées (date de dernière modification, fréquence de mise à jour, priorité de cette URL par rapport aux autres URL du site), de façon à favoriser une exploration plus intelligente du site par les robots des moteurs de recherche.

Le protocole sitemap est soutenu par Google, Yahoo! et Microsoft et est entièrement expliqué et décrit par ces trois sponsors sur le site officiel sitemaps.org.

Comment créer un sitemap XML

Un fichier sitemap XML doit :

  • Débuter par une balise d'ouverture <urlset> et terminer par une balise de fermeture </urlset>
  • Spécifier l'espace de nom (standard de protocole) dans la balise <urlset>
  • Inclure pour chaque URL une entrée <url> en tant que balise XML parent
  • Inclure une entrée enfant <loc> pour chaque balise parent <url>

Par ailleurs, le fichier XML doit être enregistré en UTF-8.

Un sitemap ne peut lister qu'au maximum 50 000 URL et la taille du fichier XML ne doit pas dépasser 10 Mo (10 485 760 octets).

Toutes les URL listées dans un fichier sitemap XML doivent provenir du même hôte, tel que mon-domaine.fr par exemple.

Voir également les ressources pour la création d'un fichier sitemap index, d'un sitemap spécifique aux contenus mobiles, d'un sitemap pour les images ou d'un sitemap multilingue.

Exemple de sitemap XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://mon-domaine.fr/</loc>
    <lastmod>2012-12-15</lastmod>
    <changefreq>daily</changefreq>
    <priority>1</priority>
  </url>
  <url>
    <loc>http://mon-domaine.fr/page-a.html</loc>
    <lastmod>2012-12-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

Pour terminer la bonne mise en place de votre sitemap, il est préconisé d'y faire référence dans le fichier robots.txt situé à la racine de votre site.

Certaines balises sont obligatoires et d'autres facultatives. Celles-ci sont décrites dans la page traitant des balises d'un fichier sitemap.