Cos'è una sitemap XML?

Una sitemap XML è un file strutturato che comunica ai motori di ricerca quali pagine di un sito web sono disponibili per la scansione. Segue un protocollo definito da Google, Bing, Yahoo e Ask.com su sitemaps.org, e utilizza un formato XML standard con uno spazio dei nomi specifico. Le sitemap aiutano i motori di ricerca a scoprire i contenuti in modo più efficiente — soprattutto per siti di grandi dimensioni, pagine nuove o pagine con pochi link in entrata.

Esistono due tipi di file sitemap: un set di URL (<urlset>), che elenca i singoli URL, e un indice sitemap (<sitemapindex>), che raggruppa più file sitemap insieme. Entrambi devono conformarsi allo stesso spazio dei nomi e alle stesse regole strutturali per essere riconosciuti dai motori di ricerca.

Descrizione dello strumento

Questo strumento convalida i file sitemap XML direttamente da un input di testo. Incolla la tua sitemap XML e lo strumento verifica istantaneamente se è conforme allo standard sitemaps.org. Verifica la struttura XML, l'elemento radice, lo spazio dei nomi e tutti gli elementi figlio — segnalando eventuali problemi con messaggi di errore precisi che includono il numero dell'URL interessato.

Esempi

Sitemap urlset valida:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2024-01-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://example.com/about</loc>
    <changefreq>yearly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

Risultato: Valida — Tipo: Set di URL, Numero di URL: 2


Sitemap non valida (spazio dei nomi errato):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.8">
  <url>
    <loc>https://example.com/</loc>
  </url>
</urlset>

Risultato: Non validaSpazio dei nomi non valido. Previsto "http://www.sitemaps.org/schemas/sitemap/0.9", ottenuto "http://www.sitemaps.org/schemas/sitemap/0.8"


Sitemap non valida (priorità errata):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/page</loc>
    <priority>1.5</priority>
  </url>
</urlset>

Risultato: Non validaURL #1: <priority> non valida — "1.5" (deve essere 0.0–1.0)

Funzionalità

  • Convalida entrambi i tipi di sitemap <urlset> e <sitemapindex>
  • Verifica la sintassi XML, il nome dell'elemento radice e lo spazio dei nomi sitemaps.org
  • Convalida ogni <loc> per la presenza e il formato URL ben formato
  • Verifica <lastmod> rispetto ai formati di data W3C, <changefreq> rispetto all'elenco dei valori consentiti e <priority> nell'intervallo 0.0–1.0
  • Segnala gli errori per voce di URL con numeri di indice per una localizzazione facile

Casi d'uso

  • Prima di inviare a Google Search Console: verifica che la tua sitemap sia strutturata correttamente in modo che non venga rifiutata durante l'indicizzazione.
  • Debug del codice di generazione della sitemap: rileva problemi come elementi <loc> mancanti, spazi dei nomi errati o valori di priorità fuori intervallo prodotti da plugin CMS o script personalizzati.
  • Convalida dei file indice sitemap: conferma che una configurazione multi-sitemap faccia correttamente riferimento alle sitemap figlie con URL validi.

Come funziona

Lo strumento analizza il testo incollato come XML utilizzando il DOMParser integrato del browser. Quindi verifica:

  1. Correttezza XML — qualsiasi errore di analisi viene segnalato testualmente
  2. Elemento radice — deve essere <urlset> o <sitemapindex>
  3. Spazio dei nomi — deve essere esattamente http://www.sitemaps.org/schemas/sitemap/0.9
  4. Regole per voce (per ogni <url> o <sitemap>):
    • <loc>: obbligatorio, deve essere un URL analizzabile
    • <lastmod>: facoltativo; se presente, deve corrispondere al formato datetime W3C (ad es. 2024-01-15 o 2024-01-15T10:00:00Z)
    • <changefreq>: facoltativo; deve essere uno di always, hourly, daily, weekly, monthly, yearly, never
    • <priority>: facoltativo; deve essere un numero tra 0.0 e 1.0

Limitazioni

  • La convalida viene eseguita interamente nel browser — non vengono effettuate richieste HTTP esterne, quindi gli URL <loc> vengono verificati solo per il formato, non per la raggiungibilità.
  • Non convalida le estensioni sitemap (sitemap immagini, sitemap video, sitemap notizie) oltre lo spazio dei nomi principale.
  • La dimensione massima dell'input è limitata dalla memoria del browser; le sitemap molto grandi (100.000+ URL) potrebbero essere lente da elaborare.

Domande frequenti

Questo strumento recupera i miei URL per verificare se funzionano? No. Tutta la convalida viene eseguita localmente nel tuo browser. Gli URL vengono verificati solo per il formato corretto, non per lo stato HTTP o il contenuto.

Quali formati <lastmod> sono accettati? Qualsiasi formato datetime W3C: YYYY, YYYY-MM, YYYY-MM-DD, YYYY-MM-DDThh:mmTZD, o YYYY-MM-DDThh:mm:ssTZD.

La mia sitemap utilizza estensioni immagini o video — verranno convalidate? La struttura principale (spazio dei nomi, <loc>, ecc.) viene convalidata. Gli elementi dagli spazi dei nomi delle estensioni (immagini, video, notizie) non vengono verificati ma non causeranno un errore di convalida.