Xenu un logiciel SEOCertains outils valent de l’or pour les référenceurs. Et Xenu en fait partie.

Vous ne le connaissez peut-être pas, mais vous ne pourrez plus vous en passer. Ce logiciel vérifie et de détecte de nombreux problèmes sur un site : duplicate content, balises en double, liens erronées, redirections non souhaitées, …

Présentation de Xenu

Xenu est un logiciel gratuit qui scanne un site Internet en long, large et en travers. Il va ainsi récupérer des informations concernant l’intégralité des pages, fichiers et liens qu’il trouvera. Tout est passé au crible : poids de la page, URL, intitulé des liens, balise title, erreurs de redirection, nombre de liens, …

Exemple de scan avec Xenu
Exemple de scan avec Xenu

Une fois le rapport terminé, il est facile de mettre en avant les défauts de conception, de structure interne, de liens et de gestion du contenu. Le but est simple : optimiser son site à la fois pour les visiteurs et pour les moteurs de recherche.

Xenu fonctionne avec un robot qui va indexer la page que vous lui indiquerez. Il va ensuite indexer chaque lien qu’il aura trouvé, et ainsi de suite. Il indexe ainsi l’intégralité du contenu d’un site, ainsi que chaque page externe trouvée. L’avantage est qu’il scanne tous les types de fichiers, ce qui inclut :

  • toutes les pages du site
  • les liens externes
  • les images
  • les fichiers de mise en page (CSS)
  • les fichiers javascripts
  • Les favicons
  • et plein d’autres éléments (fichiers xml, …)

Pour chaque élément, il donne accès à de nombreuses informations :

  • URL
  • Statut
  • Type (html, image, …)
  • Poids
  • Title (titre de la page, ou ancre permettant d’y accéder)
  • Date de création du fichier
  • Profondeur de la page (0 équivaut à la page d’accueil, 1 à une page trouvé en 1 clic, etc…)
  • Nombre de liens sortants, et de liens pointant vers la page
  • Informations serveur
  • Informations complémentaires sur le statut de la page
  • Temps de chargement
  • Charset (encodage de la page)
  • Description de la page

Libre à vous ensuite de corriger ce qui ne va pas.

Xenu et référencement naturel

L’analyse des pages

Le premier avantage de Xenu est de mettre en avant le statut d’une page ou d’un fichier, surtout lorsque le robot rencontre des problèmes d’indexation :

Exemple d'erreurs sur Xenu
Exemple d’erreurs

Voici les principaux messages d’erreurs que vous rencontrerez :

  • Redirection 301 (object permanently moved)
  • Redirection 302 (object temporarily moved)
  • Temps de chargement trop long (TimeOut)
  • Serveur indisponible temporairement (temporarily overloaded)
  • Erreur 404 (Not Found)
  • Nom de domaine inexistant (No Such Host)
  • Connexion inexistante ou annulée (No Connection, Connection aborted)
  • Url protégée (Forbiden Request)

Attention, cela ne veut pas dire que chacun de ces statuts pose problème, comme nous allons le voir juste après.

Pour les messages d’erreur Timeout et temporarily overloaded, demandez à Xenu de rescanner l’élément avec un simple clic droit sur la ligne, puisque l’erreur indique juste que le logiciel a mis tropde temps lors de son scan et qu’il a donc abandonné la ligne.

Reset Entry dans XENU
Faites Reset Entry pour re-scanner une URL dans XENU

Détecter les erreurs 404

1er avantage de Xenu pour le référencement, c’est de détecter toutes les pages d’erreurs 404.

Vous allez donc pouvoir corriger les liens qui mènent vers celles-ci, puis mettre en place un redirection 301 pour les moteurs de recherche.

Redirections 301 et 302

L’outil permet également de détecter les redirections 301 (permanentes) et les redirections 302 (temporaires). Pour rappel, voilà l’impact qu’elles ont sur le transfert de popularité d’une page :

Redirections et transfert de pagerank
Petit rappel sur l’impact des redirections (source Seomoz)

Libre à vous de corriger ou non ces redirections. Pour vos liens internes, je vous conseille cependant de le faire car elles vous font perdre inutilement une partie de votre PageRank.

Attention cependant, ces redirections ne sont pas forcément mauvaises, surtout pour les liens externes (avec l’affiliation par exemple).

Cerise sur le gâteau, il permet de détecter les redirections mises en place par les spammeurs. Par exemple, une personne va sur votre site et poste un commentaire avec un lien. 2 mois après, il met en place une redirection de sa page vers une autre, comme par exemple vers un site de pornographie… Sans cet outil, il vous sera difficile de détecter ce genre de manipulation.

Duplicate content

Là aussi, Xenu permet de détecter tout le contenu dupliqué de votre site. Vous pouvez regarder plusieurs éléments :

  • Des titres de page identiques
  • Des descriptions de page identiques
  • Un poids identique

C’est alors à vous de corriger les liens qui pointent vers les versions dupliquées de votre site.

Le maillage interne

La structure de votre site Internet peut être améliorée de différente manières avec Xenu.

  • Vous allez pouvoir contrôler l’intégralité de vos liens externe
  • Vous allez être capable de vérifier la profondeur de votre page vis-à-vis de votre home.

Plus une adresse est « profonde », moins elle sera indexée et plus vos visiteurs auront du mal à la trouver. En ce qui me concerne, je conseille d’avoir ses pages en niveau 4 maximum. Au delà, il faut revoir la structure de votre site.

Il est également possible d’obtenir la liste intégrale des liens pointant vers n’importe quelle page ou fichier de votre site. Avec un clic droit sur une URL et sur « Properties« , voici les informations que vous obtiendrez:

  • URL de la page
  • Le titre de la page
  • Les liens contenus dans cette page
  • Les autres adresses de votre site faisant un lien vers cette URL
Propriétés d'un lien avec Xenu
Propriétés d’un lien avec Xenu

Poids des pages et encodage

Diminuer le temps de chargement est crucial. Plus le site sera rapide, mieux ce sera pour les utilisateurs (et dans une moindre mesure pour les moteurs de recherche). Là aussi, Xenu permet d’avoir du premier coup d’oeil les éléments trop lourds, que ce soit vos pages, vos javascripts ou vos images.

Il arrive parfois que le développeur fasse erreur lorsqu’il encode ces fichiers (un fichier en ANSI alors que les autres sont en UTF-8). Cela peut n’avoir aucun impact, tout comme cela peut provoquer l’affichage de caractères bizarres… Là aussi, l’outil permettra de détecter et corriger rapidement le problème.

Comment utiliser Xenu

Scanner un site

Pour analyser votre site, rien de plus simple. Cliquez sur File, puis Check URL et entrez l’adresse de votre page d’accueil. Par défaut, Xenu va scanner les liens externes (ce que je vous conseille fortement). Vous avez ensuite deux blocs supplémentaires juste en dessous.

Scanner un site avec Xenu
Scanner un site avec Xenu

Le premier permet d’inclure des pages externes comme étant des adresse internes. Il continuer donc son scan une fois arrivé sur ces URLS. C’est très pratique pour les réseaux de sites placés sur plusieurs domaines ou sous-domaines.

Le second permet d’exclure des urls lors du scan, par exemple pour éviter de tester chaque bouton de partage Facebook, ou pour ne pas analyser certains répertoire de votre site.

Cliquez enfin sur OK pour lancer le scan.

Paramétrer Xenu

Il existe un menu pour optimiser le logiciel. Voici les choses à retenir

  • Parallel Threads : c’est le nombre d’url qui seront analysées en même temps. Plus votre connexion internet et votre serveur sont faibles, plus la valeur doit être basse.
  • A droite, cochez toutes les options : cela permettra de scanner tous les types d’URLs que Xenu va trouver.
  • Maximum Level : cela correspond à la profondeur de scan. Si vous mettez 5, toutes les URLs trouvées en 6 clics ne seront pas analysées.
  • Ask for Passwords : utile pour scanner des sections avec mots de passe (comme un compte client ou un Intranet)
  • Treat redirections as errors : je vous conseille de le cocher, comme expliqué précédemment.
Options de Xenu
Le menu d’options de Xenu

Dans Advanced, vous aurez accès à plusieurs options supplémentaires, que je vous déconseille. Jetez-y un œil si vous êtes curieux. Il y a juste le paramètre Retries qui est intéressant, pour forcer Xenu à re-scanner de lui-même les URLs indisponibles.

A la fin de chaque scan, vous pouvez bien sûr exporter vos données pour Excel.

Questions récurrentes sur Xenu

Je ne connais pas le serveur

Si vous ne savez pas sur quel type de serveur est le site que vous allez analyser, vous vous dites peut-être que Xenu risque de le mettre à mal. Et vous n’aurez pas tord. Même si c’est rarissime, il peut arriver qu’un crawl brutal de Xenu Link Sleuth provoque une mise hors service du site Internet visé.

Si vous ne connaissez pas bien le serveur, il est alors conseillé de réduire le nombre de connexions simultanées à 5 afin de ne pas pénaliser le site que l’on veut scanner. Sur des sites robustes, on peut cependant monter facilement à 30 ou 40 connexions en même temps.

Xenu a t-il tout analysé ?

Si une page ne répond pas lors d’un test, ou si certains contenus sont générés aléatoirement, il peut arriver que Xenu Link Sleuth n’ait pas scanné l’intégralité du site Internet.

Il est donc recommandé de toujours faire deux scans de votre site Internet, et de comparer pour chacun le nombre d’URLs total qui s’affiche en bas à droite.

De même, il est conseillé à la fin de chaque scan d’analyser une seconde fois les liens erronés, notamment pour le cas de figure où une page aurait été indisponible temporairement. Pour cela, rendez-vous dans File -> Retry Broken Links.

Xenu affiche l’ancre ou le title ?

Le logiciel Xenu affichera toujours l’ancre d’un lien dans les données qui s’affichent, jamais la balise title. Si le contenu est bizarre ou incorrect, c’est donc que votre ancre est mal renseignée.

Comme indiqué, Xenu est gratuit. Il fonctionne sur tous les Windows (de Windows 95 à Windows 7), mais je ne crois pas qu’il fonctionne sur Mac ou Linux.

Vous pourrez trouver le logiciel ici : Télécharger Xenu. Amusez-vous bien avec.

PS : et ce n’est qu’un fois avoir terminé de rédiger mon article que je me suis rendu que LinkExaminer faisait à peu près la même chose, et que les deux logiciels sont en réalité complémentaires. Je ferai un autre article dès que possible.