サイトマップ XML とは何ですか?

サイトマップ XML は、ウェブサイトのどのページがクローリング可能かを検索エンジンに伝える構造化ファイルです。Google、Bing、Yahoo、Ask.com によって sitemaps.org で定義されたプロトコルに従い、特定の名前空間を持つ標準 XML 形式を使用しています。サイトマップは、特に大規模なサイト、新しいページ、または被リンクが少ないページについて、検索エンジンがコンテンツをより効率的に発見するのに役立ちます。

サイトマップファイルには 2 つのタイプがあります。個別の URL をリストする URL セット (<urlset>) と、複数のサイトマップファイルをグループ化する サイトマップインデックス (<sitemapindex>) です。どちらも同じ名前空間と構造ルールに準拠して、検索エンジンに認識される必要があります。

ツールの説明

このツールはテキスト入力から直接サイトマップ XML ファイルを検証します。サイトマップ XML を貼り付けると、ツールは sitemaps.org 標準に準拠しているかどうかを即座にチェックします。XML 構造、ルート要素、名前空間、およびすべての子要素を検証し、影響を受ける URL 番号を含む正確なエラーメッセージで問題を報告します。

有効な urlset サイトマップ:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2024-01-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://example.com/about</loc>
    <changefreq>yearly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

結果: 有効 — タイプ: URL セット、URL 数: 2


無効なサイトマップ (間違った名前空間):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.8">
  <url>
    <loc>https://example.com/</loc>
  </url>
</urlset>

結果: 無効無効な名前空間です。"http://www.sitemaps.org/schemas/sitemap/0.9" が必要ですが、"http://www.sitemaps.org/schemas/sitemap/0.8" が指定されています


無効なサイトマップ (不正な優先度):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/page</loc>
    <priority>1.5</priority>
  </url>
</urlset>

結果: 無効URL #1: 無効な <priority> — "1.5" (0.0~1.0 である必要があります)

機能

  • <urlset><sitemapindex> の両方のサイトマップタイプを検証します
  • XML 構文、ルート要素名、sitemaps.org 名前空間をチェックします
  • <loc> の存在と整形式の URL 形式を検証します
  • <lastmod> を W3C 日付形式に対して検証し、<changefreq> を許可された値リストに対して検証し、<priority> を 0.0~1.0 の範囲内で検証します
  • URL エントリごとにインデックス番号付きのエラーを報告し、簡単に特定できるようにします

ユースケース

  • Google Search Console に送信する前に: サイトマップが正しく構造化されており、インデックス作成時に拒否されないことを確認します。
  • サイトマップ生成コードのデバッグ: CMS プラグインまたはカスタムスクリプトによって生成された、<loc> 要素の欠落、間違った名前空間、または範囲外の優先度値などの問題をキャッチします。
  • サイトマップインデックスファイルの検証: マルチサイトマップセットアップが有効な URL で子サイトマップを正しく参照していることを確認します。

仕組み

ツールは貼り付けられたテキストをブラウザの組み込み DOMParser を使用して XML として解析します。その後、以下をチェックします:

  1. XML の整形式性 — パースエラーは逐語的に報告されます
  2. ルート要素<urlset> または <sitemapindex> である必要があります
  3. 名前空間 — 正確に http://www.sitemaps.org/schemas/sitemap/0.9 である必要があります
  4. エントリごとのルール (各 <url> または <sitemap> について):
    • <loc>: 必須、解析可能な URL である必要があります
    • <lastmod>: オプション。存在する場合、W3C datetime 形式 (例: 2024-01-15 または 2024-01-15T10:00:00Z) と一致する必要があります
    • <changefreq>: オプション。alwayshourlydailyweeklymonthlyyearlynever のいずれかである必要があります
    • <priority>: オプション。0.0 から 1.0 の間の数値である必要があります

制限事項

  • 検証はブラウザ内で完全に実行されます — 外部 HTTP リクエストは行われないため、<loc> URL は形式のみチェックされ、到達可能性はチェックされません。
  • コア名前空間を超えて、画像サイトマップ、動画サイトマップ、ニュースサイトマップなどのサイトマップ拡張機能を検証しません。
  • 最大入力サイズはブラウザメモリによって制限されます。非常に大きなサイトマップ (100,000+ URL) は処理が遅い場合があります。

FAQ

このツールは URL をフェッチして動作確認しますか? いいえ。すべての検証はブラウザ内でローカルに実行されます。URL は形式のみチェックされ、HTTP ステータスやコンテンツはチェックされません。

どの <lastmod> 形式が受け入れられますか? 任意の W3C datetime 形式: YYYYYYYY-MMYYYY-MM-DDYYYY-MM-DDThh:mmTZD、または YYYY-MM-DDThh:mm:ssTZD

サイトマップが画像または動画拡張機能を使用しています — これらは検証されますか? コア構造 (名前空間、<loc> など) は検証されます。拡張名前空間 (画像、動画、ニュース) からの要素はチェックされませんが、検証失敗の原因にはなりません。