Validateur XML de sitemap
Validez les fichiers XML de sitemap. Vérifie la structure, l'espace de noms, le format d'URL, les dates lastmod, les valeurs changefreq et les plages de priorité.
Entrée
Sortie
Résultat
Aucune valeur
Documentation
Qu'est-ce qu'un sitemap XML ?
Un sitemap XML est un fichier structuré qui indique aux moteurs de recherche quelles pages d'un site web sont disponibles pour l'exploration. Il suit un protocole défini par Google, Bing, Yahoo et Ask.com sur sitemaps.org, et utilise un format XML standard avec un espace de noms spécifique. Les sitemaps aident les moteurs de recherche à découvrir le contenu plus efficacement — en particulier pour les grands sites, les nouvelles pages ou les pages avec peu de liens entrants.
Il existe deux types de fichiers sitemap : un ensemble d'URL (<urlset>), qui répertorie les URL individuelles, et un index de sitemap (<sitemapindex>), qui regroupe plusieurs fichiers sitemap ensemble. Les deux doivent se conformer au même espace de noms et aux mêmes règles structurelles pour être reconnus par les moteurs de recherche.
Description de l'outil
Cet outil valide les fichiers sitemap XML directement à partir d'une entrée de texte. Collez votre sitemap XML et l'outil vérifie instantanément s'il se conforme à la norme sitemaps.org. Il vérifie la structure XML, l'élément racine, l'espace de noms et tous les éléments enfants — signalant tout problème avec des messages d'erreur précis incluant le numéro d'URL affecté.
Exemples
Sitemap urlset valide :
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2024-01-15</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://example.com/about</loc>
<changefreq>yearly</changefreq>
<priority>0.8</priority>
</url>
</urlset>Résultat : Valide — Type : Ensemble d'URL, Nombre d'URL : 2
Sitemap invalide (mauvais espace de noms) :
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.8">
<url>
<loc>https://example.com/</loc>
</url>
</urlset>Résultat : Invalide — Espace de noms invalide. Attendu "http://www.sitemaps.org/schemas/sitemap/0.9", obtenu "http://www.sitemaps.org/schemas/sitemap/0.8"
Sitemap invalide (priorité incorrecte) :
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page</loc>
<priority>1.5</priority>
</url>
</urlset>Résultat : Invalide — URL #1 : <priority> invalide — "1.5" (doit être 0.0–1.0)
Fonctionnalités
- Valide les deux types de sitemap
<urlset>et<sitemapindex> - Vérifie la syntaxe XML, le nom de l'élément racine et l'espace de noms sitemaps.org
- Valide chaque
<loc>pour sa présence et son format d'URL bien formé - Vérifie
<lastmod>par rapport aux formats de date W3C,<changefreq>par rapport à la liste des valeurs autorisées, et<priority>dans la plage 0.0–1.0 - Signale les erreurs par entrée d'URL avec des numéros d'index pour une localisation facile
Cas d'usage
- Avant de soumettre à Google Search Console : vérifiez que votre sitemap est correctement structuré pour qu'il ne soit pas rejeté lors de l'indexation.
- Débogage du code de génération de sitemap : détectez les problèmes tels que les éléments
<loc>manquants, les mauvais espaces de noms ou les valeurs de priorité hors limites produites par les plugins CMS ou les scripts personnalisés. - Validation des fichiers d'index de sitemap : confirmez qu'une configuration multi-sitemap référence correctement les sitemaps enfants avec des URL valides.
Comment cela fonctionne
L'outil analyse le texte collé en tant que XML en utilisant le DOMParser intégré du navigateur. Il vérifie ensuite :
- Bien-formé XML — toute erreur d'analyse est signalée textuellement
- Élément racine — doit être
<urlset>ou<sitemapindex> - Espace de noms — doit être exactement
http://www.sitemaps.org/schemas/sitemap/0.9 - Règles par entrée (pour chaque
<url>ou<sitemap>):<loc>: obligatoire, doit être une URL analysable<lastmod>: optionnel ; s'il est présent, doit correspondre au format datetime W3C (par ex.2024-01-15ou2024-01-15T10:00:00Z)<changefreq>: optionnel ; doit être l'un dealways,hourly,daily,weekly,monthly,yearly,never<priority>: optionnel ; doit être un nombre entre 0.0 et 1.0
Limitations
- La validation s'exécute entièrement dans le navigateur — aucune requête HTTP externe n'est effectuée, donc les URL
<loc>sont vérifiées uniquement pour le format, pas pour l'accessibilité. - Ne valide pas les extensions de sitemap (sitemap d'images, sitemap vidéo, sitemap d'actualités) au-delà de l'espace de noms principal.
- La taille d'entrée maximale est limitée par la mémoire du navigateur ; les très grands sitemaps (100 000+ URL) peuvent être lents à traiter.
FAQ
Cet outil récupère-t-il mes URL pour vérifier si elles fonctionnent ? Non. Toute la validation est effectuée localement dans votre navigateur. Les URL sont uniquement vérifiées pour un format correct, pas pour le statut HTTP ou le contenu.
Quels formats <lastmod> sont acceptés ?
Tout format datetime W3C : YYYY, YYYY-MM, YYYY-MM-DD, YYYY-MM-DDThh:mmTZD, ou YYYY-MM-DDThh:mm:ssTZD.
Mon sitemap utilise des extensions d'images ou vidéo — celles-ci seront-elles validées ?
La structure principale (espace de noms, <loc>, etc.) est validée. Les éléments des espaces de noms d'extension (image, vidéo, actualités) ne sont pas vérifiés mais ne causeront pas d'échec de validation.