Sitemap XML सत्यापनकर्ता
Sitemap XML फ़ाइलों को सत्यापित करें। संरचना, namespace, URL प्रारूप, lastmod तारीखें, changefreq मान और प्राथमिकता श्रेणियों की जांच करता है।
इनपुट
आउटपुट
परिणाम
कोई मान नहीं
रीडमी
sitemap XML क्या है?
sitemap XML एक संरचित फ़ाइल है जो सर्च इंजन को बताती है कि वेबसाइट के कौन से पेज क्रॉल करने के लिए उपलब्ध हैं। यह Google, Bing, Yahoo, और Ask.com द्वारा sitemaps.org पर परिभाषित प्रोटोकॉल का पालन करता है, और एक विशिष्ट namespace के साथ मानक XML प्रारूप का उपयोग करता है। Sitemaps सर्च इंजन को सामग्री को अधिक कुशलतापूर्वक खोजने में मदद करते हैं — विशेष रूप से बड़ी साइटों, नए पेजों, या कम इनबाउंड लिंक वाले पेजों के लिए।
दो प्रकार की sitemap फ़ाइलें हैं: एक URL set (<urlset>), जो व्यक्तिगत URLs को सूचीबद्ध करता है, और एक sitemap index (<sitemapindex>), जो कई sitemap फ़ाइलों को एक साथ समूहित करता है। दोनों को सर्च इंजन द्वारा पहचाने जाने के लिए एक ही namespace और संरचनात्मक नियमों का पालन करना चाहिए।
टूल विवरण
यह टूल sitemap XML फ़ाइलों को सीधे टेक्स्ट इनपुट से सत्यापित करता है। अपने sitemap XML को पेस्ट करें और टूल तुरंत जांचता है कि क्या यह sitemaps.org मानक के अनुरूप है। यह XML संरचना, रूट एलिमेंट, namespace, और सभी चाइल्ड एलिमेंट्स को सत्यापित करता है — प्रभावित URL नंबर सहित सटीक त्रुटि संदेशों की रिपोर्ट करता है।
उदाहरण
वैध urlset sitemap:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2024-01-15</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://example.com/about</loc>
<changefreq>yearly</changefreq>
<priority>0.8</priority>
</url>
</urlset>परिणाम: वैध — प्रकार: URL Set, URL गणना: 2
अमान्य sitemap (गलत namespace):
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.8">
<url>
<loc>https://example.com/</loc>
</url>
</urlset>परिणाम: अमान्य — अमान्य namespace। अपेक्षित "http://www.sitemaps.org/schemas/sitemap/0.9", मिला "http://www.sitemaps.org/schemas/sitemap/0.8"
अमान्य sitemap (खराब priority):
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page</loc>
<priority>1.5</priority>
</url>
</urlset>परिणाम: अमान्य — URL #1: अमान्य <priority> — "1.5" (0.0–1.0 के बीच होना चाहिए)
विशेषताएं
<urlset>और<sitemapindex>दोनों sitemap प्रकारों को सत्यापित करता है- XML सिंटैक्स, रूट एलिमेंट नाम, और sitemaps.org namespace की जांच करता है
- प्रत्येक
<loc>को उपस्थिति और सुगठित URL प्रारूप के लिए सत्यापित करता है <lastmod>को W3C दिनांक प्रारूपों के विरुद्ध सत्यापित करता है,<changefreq>को अनुमत मान सूची के विरुद्ध, और<priority>को 0.0–1.0 रेंज में- आसान स्थान निर्धारण के लिए इंडेक्स नंबर के साथ प्रति URL प्रविष्टि त्रुटियों की रिपोर्ट करता है
उपयोग के मामले
- Google Search Console को सबमिट करने से पहले: सत्यापित करें कि आपका sitemap सही तरीके से संरचित है ताकि इंडेक्सिंग के दौरान अस्वीकार न किया जाए।
- Sitemap जनरेशन कोड को डीबग करना: CMS प्लगइन्स या कस्टम स्क्रिप्ट्स द्वारा उत्पादित लापता
<loc>एलिमेंट्स, गलत namespaces, या आउट-ऑफ-रेंज priority मानों जैसी समस्याओं को पकड़ें। - Sitemap index फ़ाइलों को सत्यापित करना: पुष्टि करें कि एक बहु-sitemap सेटअप सही तरीके से वैध URLs के साथ चाइल्ड sitemaps को संदर्भित करता है।
यह कैसे काम करता है
टूल पेस्ट किए गए टेक्स्ट को ब्राउज़र के बिल्ट-इन DOMParser का उपयोग करके XML के रूप में पार्स करता है। फिर यह जांचता है:
- XML well-formedness — कोई भी पार्स त्रुटि शब्दशः रिपोर्ट की जाती है
- रूट एलिमेंट —
<urlset>या<sitemapindex>होना चाहिए - Namespace — बिल्कुल
http://www.sitemaps.org/schemas/sitemap/0.9होना चाहिए - प्रति-प्रविष्टि नियम (प्रत्येक
<url>या<sitemap>के लिए):<loc>: आवश्यक, एक पार्सेबल URL होना चाहिए<lastmod>: वैकल्पिक; यदि मौजूद है, तो W3C datetime प्रारूप से मेल खाना चाहिए (जैसे2024-01-15या2024-01-15T10:00:00Z)<changefreq>: वैकल्पिक;always,hourly,daily,weekly,monthly,yearly,neverमें से एक होना चाहिए<priority>: वैकल्पिक; 0.0 और 1.0 के बीच एक संख्या होनी चाहिए
सीमाएं
- सत्यापन पूरी तरह से ब्राउज़र में चलता है — कोई बाहरी HTTP अनुरोध नहीं किए जाते हैं, इसलिए
<loc>URLs को केवल प्रारूप के लिए जांचा जाता है, पहुंच के लिए नहीं। - Core namespace से परे sitemap एक्सटेंशन (इमेज sitemap, वीडियो sitemap, समाचार sitemap) को सत्यापित नहीं करता है।
- अधिकतम इनपुट आकार ब्राउज़र मेमोरी द्वारा सीमित है; बहुत बड़े sitemaps (100,000+ URLs) को प्रक्रिया करने में धीमा हो सकता है।
FAQ
क्या यह टूल यह जांचने के लिए मेरे URLs को फ़ेच करता है कि क्या वे काम करते हैं? नहीं। सभी सत्यापन आपके ब्राउज़र में स्थानीय रूप से किया जाता है। URLs को केवल सही प्रारूप के लिए जांचा जाता है, HTTP स्थिति या सामग्री के लिए नहीं।
कौन से <lastmod> प्रारूप स्वीकार किए जाते हैं?
कोई भी W3C datetime प्रारूप: YYYY, YYYY-MM, YYYY-MM-DD, YYYY-MM-DDThh:mmTZD, या YYYY-MM-DDThh:mm:ssTZD।
मेरा sitemap इमेज या वीडियो एक्सटेंशन का उपयोग करता है — क्या उन्हें सत्यापित किया जाएगा?
Core संरचना (namespace, <loc>, आदि) को सत्यापित किया जाता है। एक्सटेंशन namespaces (इमेज, वीडियो, समाचार) से एलिमेंट्स की जांच नहीं की जाती है लेकिन सत्यापन विफलता का कारण नहीं बनेंगे।