
Quel web designer, webmaster ou S.E.O. ne s'est pas posé la question de savoir quelle action pour résoudre le problème que pose la page 404 face au référencement de ces pages qui ont été déplacées ou supprimées mais qui continuent par être listées par Google, Yahoo ou Bing.
Par défaut un serveur web comme Apache affiche une ErrorDocument 404 lorsqu'un navigateur tente d'accéder à une page qui n'existe plus à l'adresse demandée. Pour éviter ce problème l'idée est d'une page de configurer à l'aide d'un fichier .htaccess (qui n'est autre qu'un fichier texte htaccess que vous allez placer sur votre serveur Apache et le renommer ".htaccess" comme une sorte d'extension longue). Ce fichier vous le récupérer ensuite de votre serveur et vous allez pouvoir l'éditer dans un NotePad (ou tout éditeur de texte au format brut sans aucun formatage) et vous allez y inscrire par exemple (sans prendre en compte l'italique appliqué sur mon exemple) :
ErrorDocument 404 /sitemap.htm
Cela va signifier au serveur qu'en cas d'erreur 404 (page introuvable), au lieu d'afficher une page d'erreur systeme en noir et blanc bien fade et terriblement rédhibitoire pour l'internaute, d'aller à la racine du site Internet chercher le plan du site qu'il affichera et permettra ainsi à l'internaute de retrouver le document ou la rubrique auquel il appartient peut etre maintenant. L'avantage de cette solution est bien évidemment que votre page sitemap.html pourra visuellement reprendre l'esthétique de votre site web. L'internaute vous remerciera de cette attention ;) De plus - et c'est sans doute le plus important du point de vue du référencement - cette instruction serveur ne perturbera pas les robots des moteurs de recherche qui recevront bien le code HTTP 404 et procèderont alors à la suppression de la page dans leur index.
Mais attention à ne pas commettre un impair dans ce fichier
ErrorDocument 404 http://www.nomdedomaine.com/sitemap.htm
D'apparence, cette ligne ressemble à l'exemple que nous avons vu précédemment et pourtant en saisissant l'adresse http vous commettez une lourde erreur car, certes vous allez redirigez l'internaute vers le plan du site, mais par la même occasion vous allez induire les robots d'indexation en erreur. Ceux-ci ne vont plus interpreter cela comme une "erreur 404" mais comme une instruction de "redirection 302". La page indexée ne sera alors pas retirer de l'index du moteur et vous risquez très vite de vous faire bannir pour "duplicate content" si jamais plusieurs anciennes erreurs 404 se mettaient à référencer à chaque fois le contenu de votre sitemap ...
Il est possible de transformer l’instruction ErrorDocument 404 en redirection 301. Pour cela, il vous suffit de saisir la ligne de code suivante dans votre fichier htaccess :
ErrorDocument 404 /404to301.php
Et votre fichier 404to301.php devra alors contenir ce code:
<?php header("Status: 301 Moved Permanently", false, 301); header("Location: http://www.nomdedomaine.com/sitemap.htm"); exit(); ?>
Pour les robots d'indexation, ce code HTTP 301 signifie que l’adresse demandée est caduque et qu’ils doivent la remplacer dans leur index par l’adresse de la redirection. Dans notre exemple, ce sera une nouvelle fois l’adresse du plan du site (sitemap.htm) présent à la racine du site web. Dernier avantage, et non des moindres, cette solution permet de conserveur le poids des backlinks et donc le PageRank Google des adresses erronées.
Ajouter un commentaire