Was ist eine Sitemap XML?

Eine Sitemap XML ist eine strukturierte Datei, die Suchmaschinen mitteilt, welche Seiten einer Website zum Crawlen verfügbar sind. Sie folgt einem Protokoll, das von Google, Bing, Yahoo und Ask.com unter sitemaps.org definiert wurde, und verwendet ein Standard-XML-Format mit einem spezifischen Namespace. Sitemaps helfen Suchmaschinen, Inhalte effizienter zu entdecken — besonders bei großen Websites, neuen Seiten oder Seiten mit wenigen eingehenden Links.

Es gibt zwei Arten von Sitemap-Dateien: ein URL-Set (<urlset>), das einzelne URLs auflistet, und einen Sitemap-Index (<sitemapindex>), der mehrere Sitemap-Dateien zusammenfasst. Beide müssen dem gleichen Namespace und den gleichen Strukturregeln entsprechen, um von Suchmaschinen erkannt zu werden.

Werkzeugbeschreibung

Dieses Werkzeug validiert Sitemap-XML-Dateien direkt aus einer Texteingabe. Fügen Sie Ihre Sitemap XML ein und das Werkzeug überprüft sofort, ob sie dem sitemaps.org-Standard entspricht. Es überprüft die XML-Struktur, das Root-Element, den Namespace und alle untergeordneten Elemente — und meldet alle Probleme mit präzisen Fehlermeldungen einschließlich der betroffenen URL-Nummer.

Beispiele

Gültiges urlset-Sitemap:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2024-01-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://example.com/about</loc>
    <changefreq>yearly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

Ergebnis: Gültig — Typ: URL-Set, URL-Anzahl: 2


Ungültiges Sitemap (falscher Namespace):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.8">
  <url>
    <loc>https://example.com/</loc>
  </url>
</urlset>

Ergebnis: UngültigUngültiger Namespace. Erwartet "http://www.sitemaps.org/schemas/sitemap/0.9", erhalten "http://www.sitemaps.org/schemas/sitemap/0.8"


Ungültiges Sitemap (ungültige Priorität):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/page</loc>
    <priority>1.5</priority>
  </url>
</urlset>

Ergebnis: UngültigURL #1: ungültige <priority> — "1.5" (muss 0.0–1.0 sein)

Funktionen

  • Validiert sowohl <urlset> als auch <sitemapindex> Sitemap-Typen
  • Überprüft XML-Syntax, Root-Element-Name und sitemaps.org-Namespace
  • Validiert jedes <loc> auf Vorhandensein und korrektes URL-Format
  • Überprüft <lastmod> gegen W3C-Datumsformate, <changefreq> gegen die zulässige Werteliste und <priority> im Bereich 0.0–1.0
  • Meldet Fehler pro URL-Eintrag mit Indexnummern zur einfachen Lokalisierung

Anwendungsfälle

  • Vor der Übermittlung an Google Search Console: Überprüfen Sie, dass Ihr Sitemap korrekt strukturiert ist, damit es bei der Indexierung nicht abgelehnt wird.
  • Debugging von Sitemap-Generierungscode: Erfassen Sie Probleme wie fehlende <loc>-Elemente, falsche Namespaces oder außerhalb des Bereichs liegende Prioritätswerte, die von CMS-Plugins oder benutzerdefinierten Skripten erzeugt werden.
  • Validierung von Sitemap-Index-Dateien: Bestätigen Sie, dass ein Multi-Sitemap-Setup korrekt auf untergeordnete Sitemaps mit gültigen URLs verweist.

Funktionsweise

Das Werkzeug analysiert den eingefügten Text als XML mit dem integrierten DOMParser des Browsers. Anschließend überprüft es:

  1. XML-Wohlgeformtheit — alle Parse-Fehler werden wörtlich gemeldet
  2. Root-Element — muss <urlset> oder <sitemapindex> sein
  3. Namespace — muss genau http://www.sitemaps.org/schemas/sitemap/0.9 sein
  4. Pro-Eintrag-Regeln (für jedes <url> oder <sitemap>):
    • <loc>: erforderlich, muss eine analysierbare URL sein
    • <lastmod>: optional; falls vorhanden, muss dem W3C-Datetime-Format entsprechen (z. B. 2024-01-15 oder 2024-01-15T10:00:00Z)
    • <changefreq>: optional; muss eines der folgenden sein: always, hourly, daily, weekly, monthly, yearly, never
    • <priority>: optional; muss eine Zahl zwischen 0.0 und 1.0 sein

Einschränkungen

  • Die Validierung läuft vollständig im Browser — es werden keine externen HTTP-Anfragen gestellt, daher werden <loc>-URLs nur auf Format überprüft, nicht auf Erreichbarkeit.
  • Validiert keine Sitemap-Erweiterungen (Bild-Sitemap, Video-Sitemap, News-Sitemap) über den Core-Namespace hinaus.
  • Die maximale Eingabegröße ist durch den Browser-Speicher begrenzt; sehr große Sitemaps (100.000+ URLs) können langsam zu verarbeiten sein.

Häufig gestellte Fragen

Ruft dieses Werkzeug meine URLs ab, um zu überprüfen, ob sie funktionieren? Nein. Alle Validierungen werden lokal in Ihrem Browser durchgeführt. URLs werden nur auf korrektes Format überprüft, nicht auf HTTP-Status oder Inhalt.

Welche <lastmod>-Formate werden akzeptiert? Alle W3C-Datetime-Formate: YYYY, YYYY-MM, YYYY-MM-DD, YYYY-MM-DDThh:mmTZD oder YYYY-MM-DDThh:mm:ssTZD.

Mein Sitemap verwendet Bild- oder Video-Erweiterungen — werden diese validiert? Die Kernstruktur (Namespace, <loc> usw.) wird validiert. Elemente aus Erweiterungs-Namespaces (Bild, Video, News) werden nicht überprüft, führen aber nicht zu einem Validierungsfehler.