Article mis à jour le 14/04/2010

Centre Webmaster de Google
Centre Webmaster de Google

Les fichiers sitemaps sont un atout indéniable pour aider les différents moteurs de recherche à accéder à l’intégralité des pages d’un site. Ils n’améliorent pas le référencement, mais permettent aux différents crawlers de Google, Yahoo et Bing de pouvoir indexer rapidement de nouveaux contenus présents dans un site.

Mais jusqu’à maintenant, les images ne pouvaient être indexées via un fichier sitemap. C’est désormais chose faite, du moins pour Google.

Pour chaque URL listée dans votre fichier sitemap, il est désormais possible d’ajouter des informations sur les images importantes contenues dans la page. L’idée est donc d’accélérer l’indexation de vos images présentes dans vos pages.

Voici un exemple type de code sitemap avec image :

<?xml version="1.0" encoding="UTF-8"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="http://www.google.com/schemas/
sitemap-image/1.1">
<url>
<loc>http://example.com/sample.html</loc>
<image:image>
<image:loc>http://example.com/image.jpg</image:loc>
<image:title>Titre de mon image</image:title>
<image:caption>Légende de mon image</image:caption>
<image:license>http://example.com/adressse-license.html</image:license>
<image:geo_location>Nantes, France</image:geo_location>
</image:image>
</url>
</urlset>

Un sitemap classique

Il faut donc avant tout créer un fichier sitemap standard.

Pour ceux qui ont un trou de mémoire, un fichier sitemap est un fichier qui regroupe l’ensemble des pages d’un site web. Il aide les moteurs de recherche à référencer votre site. Attention, comme expliqué précédemment, il ne rend pas meilleur votre référencement, mais seulement plus rapide puisqu’il permet aux différents moteurs de trouver dans un fichier l’intégralité des pages de votre site.

Petits rappels :

  • Votre sitemap ne pourra contenir que 50 000 url maximum (enfin, d’ici à ce que vous arriviez à ce chiffre…)
  • On définit une url avec l’adresse complète, et non pas avec le chemin relatif
  • Le fichier doit être codé en UTF-8 et être uniquement composé de caractères ASCII pour pouvoir être lu par Google

Google prend donc en charge le protocole Sitemap 0.9 (défini sur le site sitemaps.org). Un exemple de sitemap basique :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>

Un sitemap commence par la version xml, et le urlset qui définit la version du fichier sitemap. Ensuite, il faut ajouter un bloc url par page de votre site, avec les champs suivants:

  • <loc> pour l’url de la page
  • <lastmod> pour la dernière date de modification, au format YYYY-MM-DD
  • <changefreq> pour définir la période au bout de laquelle cette page est généralement mise à jour. Cela indique donc au moteur au bout de combien de temps il devrait venir revérifier cette page (même s’il ne le fera pas forcément). Les valeurs possibles sont : always (attention, définit une page qui change à chaque rechargement de page), hourly, daily, weekly, monthly, yearly et never
  • <priority>: ce champs du sitemap définit l’importance de la page par rapport aux autres pages du site. La valeur va de 0.0 à 1.0. La valeur par défaut est 0.5.

Voilà votre sitemap prêt à être utilisé.

Un sitemap avec Images

Google n’a pas créé un nouveau format de fichier sitemap. En l’occurrence, il a juste mis à jour sa gestion interne des sitemaps pour prendre en compte les champs images.

Pour ajouter les informations liées à l’image d’une url, il faut donc placer des informations supplémentaires dans le champ <url>.

Les champs obligatoires sont :

  • <image:image> : balise à l’intérieure de laquelle on place tous les informations relatives à une image
  • <image:loc> : l’adresse de l’image

Les champs facultatifs sont :

  • <image:geo_location> : la localisation géographique de l’image
  • <image:title> : le titre de l’image, qui correspond à la balise alt de l’image
  • <image:caption> : la légende de l’image, qui correspond à l’attribut longdesc d’une image
  • <image:license> : l’url expliquant la licence pour utiliser cette image (creative commons, …)

A priori, on pourrait indiquer jusqu’à 1000 images par URL (mais je ne vois pas trop l’utilité).

N’oubliez surtout pas d’ajouter la ligne suivante dans le urlset :

xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"

Les champs liés à l’image se placent à la suite des champs relatifs à l’url, avant </url>.

Voici l’exemple complet du sitemap :

<?xml version="1.0" encoding="UTF-8"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="http://www.google.com/schemas/
sitemap-image/1.1">
<url>
<loc>http://example.com/sample.html</loc>
<lastmod>2010-04-13</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
<image:image>
<image:loc>http://example.com/image.jpg</image:loc>
<image:title>Titre de mon image</image:title>
<image:caption>Légende de mon image</image:caption>
<image:license>http://example.com/adressse-license.html</image:license>
<image:geo_location>Nantes, France</image:geo_location>
</image:image>
</url>
</urlset>

L’intérêt du Sitemap Image

Google fait donc un premier pas pour faciliter et accélérer l’indexation des images via sitemap . Mais cela pose encore quelques problèmes :

  • Seul Google prend en charge ce format image. Bye bye Bing et Yahoo.
  • Aucune information sur le poids donné aux différents champs facultatifs. Il faudra donc attendre pour connaître l’impact que cela aura sur le référencement naturel des images .

Sachez également qu’il existe des formats de sitemaps spécifiques pour Google Actualité, pour Google Vidéo, pour Google Recherche de Code, pour les Sitemaps géographiques ou les Sitemaps Mobiles.

Pensez à ajouter votre sitemap dans le centre webmaster de Google ainsi que dans votre fichier robots.txt sous la forme :

Sitemap : http://example.com/emplacement_sitemap.xml

Dernière chose pour rigoler un peu, une petite citation d’une des pages d’aides du centre webmaster de Google, qui ne semble pas très à jour…

Nous ne vous garantissons pas que toutes vos URL seront explorées ou indexées. Par exemple, les URL d’images contenues dans votre sitemap ne seront ni explorées, ni indexées.

Bon référencement à tous.