Hva er et sitemap XML?

Et sitemap XML er en strukturert fil som forteller søkemotorer hvilke sider på et nettsted som er tilgjengelige for crawling. Det følger en protokoll definert av Google, Bing, Yahoo og Ask.com på sitemaps.org, og bruker et standard XML-format med et spesifikt navnerom. Sitemaps hjelper søkemotorer med å oppdage innhold mer effektivt — spesielt for store nettsteder, nye sider eller sider med få innkommende lenker.

Det finnes to typer sitemap-filer: et URL-sett (<urlset>), som viser individuelle URL-er, og et sitemap-indeks (<sitemapindex>), som grupperer flere sitemap-filer sammen. Begge må være i samsvar med samme navnerom og strukturelle regler for å bli gjenkjent av søkemotorer.

Verktøybeskrivelse

Dette verktøyet validerer sitemap XML-filer direkte fra tekstinput. Lim inn sitemap XML-en din, og verktøyet sjekker umiddelbart om den er i samsvar med sitemaps.org-standarden. Det verifiserer XML-strukturen, rotelementet, navnerommet og alle underelementer — og rapporterer eventuelle problemer med presise feilmeldinger inkludert det berørte URL-nummeret.

Eksempler

Gyldig urlset sitemap:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2024-01-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://example.com/about</loc>
    <changefreq>yearly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

Resultat: Gyldig — Type: URL-sett, URL-antall: 2


Ugyldig sitemap (feil navnerom):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.8">
  <url>
    <loc>https://example.com/</loc>
  </url>
</urlset>

Resultat: UgyldigUgyldig navnerom. Forventet "http://www.sitemaps.org/schemas/sitemap/0.9", fikk "http://www.sitemaps.org/schemas/sitemap/0.8"


Ugyldig sitemap (dårlig prioritet):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/page</loc>
    <priority>1.5</priority>
  </url>
</urlset>

Resultat: UgyldigURL #1: ugyldig <priority> — "1.5" (må være 0.0–1.0)

Funksjoner

  • Validerer både <urlset> og <sitemapindex> sitemap-typer
  • Sjekker XML-syntaks, rotelementnavn og sitemaps.org-navnerom
  • Validerer hver <loc> for tilstedeværelse og velformet URL-format
  • Verifiserer <lastmod> mot W3C-datoformater, <changefreq> mot listen over tillatte verdier, og <priority> innenfor området 0.0–1.0
  • Rapporterer feil per URL-oppføring med indeksnumre for enkel lokalisering

Brukstilfeller

  • Før innsending til Google Search Console: verifiser at sitemap-en din er korrekt strukturert slik at den ikke blir avvist under indeksering.
  • Feilsøking av sitemap-genereringskode: oppdag problemer som manglende <loc>-elementer, feil navnerom eller prioritetsverdier utenfor området produsert av CMS-plugins eller egendefinerte skript.
  • Validering av sitemap-indeksfiler: bekreft at et multi-sitemap-oppsett korrekt refererer til underordnede sitemaps med gyldige URL-er.

Hvordan det fungerer

Verktøyet analyserer den limte teksten som XML ved hjelp av nettleserens innebygde DOMParser. Det sjekker deretter:

  1. XML-velformerthet — enhver parsefeil rapporteres ordrett
  2. Rotelement — må være <urlset> eller <sitemapindex>
  3. Navnerom — må være nøyaktig http://www.sitemaps.org/schemas/sitemap/0.9
  4. Regler per oppføring (for hver <url> eller <sitemap>):
    • <loc>: obligatorisk, må være en tolkbar URL
    • <lastmod>: valgfritt; hvis tilstede, må samsvare med W3C datetime-formatet (f.eks. 2024-01-15 eller 2024-01-15T10:00:00Z)
    • <changefreq>: valgfritt; må være en av always, hourly, daily, weekly, monthly, yearly, never
    • <priority>: valgfritt; må være et tall mellom 0.0 og 1.0

Begrensninger

  • Validering kjøres helt i nettleseren — ingen eksterne HTTP-forespørsler gjøres, så <loc> URL-er sjekkes kun for format, ikke tilgjengelighet.
  • Validerer ikke sitemap-utvidelser (bildesitemap, videositemap, nyhetssitemap) utover kjernnavnerommet.
  • Maksimal inputstørrelse er begrenset av nettleserminne; veldig store sitemaps (100 000+ URL-er) kan være treg å behandle.

Vanlige spørsmål

Henter dette verktøyet URL-ene mine for å sjekke om de fungerer? Nei. All validering gjøres lokalt i nettleseren din. URL-er sjekkes kun for korrekt format, ikke for HTTP-status eller innhold.

Hvilke <lastmod>-formater aksepteres? Ethvert W3C datetime-format: YYYY, YYYY-MM, YYYY-MM-DD, YYYY-MM-DDThh:mmTZD, eller YYYY-MM-DDThh:mm:ssTZD.

Sitemap-en min bruker bilde- eller videoutvidelser — vil disse bli validert? Kjernstrukturen (navnerom, <loc>, osv.) valideres. Elementer fra utvidelsesnavnerom (bilde, video, nyheter) sjekkes ikke, men vil ikke forårsake valideringsfeil.