Sitemap XML -validaattori
Validoi sitemap XML -tiedostot. Tarkistaa rakenteen, nimitilan, URL-muodon, lastmod-päivämäärät, changefreq-arvot ja prioriteettialueet.
Syöte
Tuloste
Tulos
Ei arvoa
Lue lisää
Mikä on sitemap XML?
Sitemap XML on strukturoitu tiedosto, joka kertoo hakukoneilleille, mitkä verkkosivuston sivut ovat saatavilla indeksoitavaksi. Se noudattaa Googlen, Bingin, Yahoon ja Ask.comin määrittelemää protokollaa osoitteessa sitemaps.org, ja käyttää vakio-XML-muotoa tietyllä nimiavaruudella. Sitemapien avulla hakukoneet löytävät sisällön tehokkaammin — erityisesti suurilla sivustoilla, uusilla sivuilla tai sivuilla, joilla on vähän saapuvia linkkejä.
Sitemapeja on kahta tyyppiä: URL-joukko (<urlset>), joka luettelee yksittäisiä URL-osoitteita, ja sitemap-indeksi (<sitemapindex>), joka ryhmittelee useita sitemap-tiedostoja yhteen. Molempien on noudatettava samaa nimiavaruutta ja rakennesääntöjä, jotta hakukoneet tunnistaisivat ne.
Työkalun kuvaus
Tämä työkalu validoi sitemap XML -tiedostoja suoraan tekstisyötteestä. Liitä sitemap XML ja työkalu tarkistaa välittömästi, noudattaako se sitemaps.org-standardia. Se varmistaa XML-rakenteen, juurielementin, nimiavaruuden ja kaikki alielementit — raportoi kaikki ongelmat tarkoilla virheilmoituksilla, joissa mainitaan vaikuttunut URL-numero.
Esimerkit
Kelvollinen urlset-sitemap:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2024-01-15</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://example.com/about</loc>
<changefreq>yearly</changefreq>
<priority>0.8</priority>
</url>
</urlset>Tulos: Kelvollinen — Tyyppi: URL-joukko, URL-määrä: 2
Virheellinen sitemap (väärä nimiavaruus):
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.8">
<url>
<loc>https://example.com/</loc>
</url>
</urlset>Tulos: Virheellinen — Invalid namespace. Expected "http://www.sitemaps.org/schemas/sitemap/0.9", got "http://www.sitemaps.org/schemas/sitemap/0.8"
Virheellinen sitemap (väärä prioriteetti):
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page</loc>
<priority>1.5</priority>
</url>
</urlset>Tulos: Virheellinen — URL #1: invalid <priority> — "1.5" (must be 0.0–1.0)
Ominaisuudet
- Validoi sekä
<urlset>että<sitemapindex>sitemap-tyypit - Tarkistaa XML-syntaksin, juurielementin nimen ja sitemaps.org-nimiavaruuden
- Validoi jokaisen
<loc>elementin läsnäolon ja hyvin muodostetun URL-muodon - Varmistaa
<lastmod>elementin W3C-päivämäärämuotoja vastaan,<changefreq>sallittujen arvojen listaa vastaan ja<priority>arvojen olevan 0.0–1.0 välillä - Raportoi virheet URL-merkinnöittäin indeksinumeroilla helppoa paikantamista varten
Käyttötapaukset
- Ennen lähettämistä Google Search Consoleen: varmista, että sitemap on oikein strukturoitu, jotta se ei hylätä indeksoinnin aikana.
- Sitemap-luontikoodin debuggaus: havaitse ongelmat, kuten puuttuvat
<loc>elementit, väärät nimiavaruudet tai CMS-laajennuksien tai mukautettujen skriptien tuottamat virheelliset prioriteettiarvot. - Sitemap-indeksitiedostojen validointi: varmista, että usean sitemapin asetelmassa viitataan oikein alasitemappeihin kelvollisilla URL-osoitteilla.
Kuinka se toimii
Työkalu jäsentää liitetyn tekstin XML-muodossa käyttäen selaimen sisäänrakennettua DOMParser-ohjelmaa. Sitten se tarkistaa:
- XML-hyvinmuodosteisuus — kaikki jäsennyvirheet raportoidaan sellaisenaan
- Juurielementti — on oltava
<urlset>tai<sitemapindex> - Nimiavaruus — on oltava täsmälleen
http://www.sitemaps.org/schemas/sitemap/0.9 - Merkintäkohtaiset säännöt (jokaiselle
<url>tai<sitemap>elementille):<loc>: pakollinen, on oltava jäsennettävä URL<lastmod>: valinnainen; jos läsnä, on vastattava W3C datetime -muotoa (esim.2024-01-15tai2024-01-15T10:00:00Z)<changefreq>: valinnainen; on oltava yksi seuraavista:always,hourly,daily,weekly,monthly,yearly,never<priority>: valinnainen; on oltava luku välillä 0.0 ja 1.0
Rajoitukset
- Validointi suoritetaan kokonaan selaimessa — ulkoisia HTTP-pyyntöjä ei tehdä, joten
<loc>URL-osoitteet tarkistetaan vain muodon osalta, ei saavutettavuuden osalta. - Ei validoi sitemap-laajennuksia (kuvasitemap, videositemap, uutissitemap) ydinnimiavaruuden ulkopuolella.
- Enimmäissyötteen koko on rajoitettu selaimen muistilla; erittäin suuret sitemappit (100 000+ URL-osoitetta) voivat olla hitaita käsitellä.
Usein kysytyt kysymykset
Haetaanko tämä työkalu URL-osoitteita tarkistaakseen, toimivatko ne? Ei. Kaikki validointi tehdään paikallisesti selaimessasi. URL-osoitteet tarkistetaan vain oikean muodon osalta, ei HTTP-statusta tai sisältöä.
Mitkä <lastmod> muodot hyväksytään?
Mikä tahansa W3C datetime -muoto: YYYY, YYYY-MM, YYYY-MM-DD, YYYY-MM-DDThh:mmTZD tai YYYY-MM-DDThh:mm:ssTZD.
Sitemapissani käytetään kuva- tai videolaajennus — validoidaanko nämä?
Ydinrakenne (nimiavaruus, <loc> jne.) validoidaan. Laajennusnimiavaruuksien (kuva, video, uutiset) elementtejä ei tarkisteta, mutta ne eivät aiheuta validointivirhettä.