محقق Sitemap XML
تحقق من صحة ملفات sitemap XML. يتحقق من الهيكل والمساحة الاسمية وتنسيق URL وتواريخ lastmod وقيم changefreq ونطاقات الأولوية.
الإدخال
الإخراج
النتيجة
لا قيمة
ملف القراءة
ما هو ملف sitemap XML؟
ملف sitemap XML هو ملف منظم يخبر محركات البحث عن الصفحات المتاحة على موقع الويب للزحف إليها. يتبع بروتوكول محدد من قبل Google و Bing و Yahoo و Ask.com على sitemaps.org، ويستخدم تنسيق XML قياسي مع namespace محدد. تساعد Sitemaps محركات البحث على اكتشاف المحتوى بكفاءة أكبر — خاصة للمواقع الكبيرة والصفحات الجديدة أو الصفحات التي تحتوي على عدد قليل من الروابط الواردة.
هناك نوعان من ملفات sitemap: مجموعة URL (<urlset>)، التي تسرد عناوين URL الفردية، و فهرس sitemap (<sitemapindex>)، الذي يجمع ملفات sitemap متعددة معاً. يجب أن يتوافق كلاهما مع نفس namespace والقواعس الهيكلية ليتم التعرف عليهما من قبل محركات البحث.
وصف الأداة
تتحقق هذه الأداة من صحة ملفات sitemap XML مباشرة من إدخال نصي. الصق ملف sitemap XML الخاص بك وستتحقق الأداة على الفور مما إذا كان يتوافق مع معيار sitemaps.org. تتحقق من بنية XML والعنصر الجذر والـ namespace وجميع العناصر الفرعية — مع الإبلاغ عن أي مشاكل برسائل خطأ دقيقة تتضمن رقم URL المتأثر.
أمثلة
sitemap urlset صحيح:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2024-01-15</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://example.com/about</loc>
<changefreq>yearly</changefreq>
<priority>0.8</priority>
</url>
</urlset>النتيجة: صحيح — النوع: مجموعة URL، عدد URLs: 2
sitemap غير صحيح (namespace خاطئ):
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.8">
<url>
<loc>https://example.com/</loc>
</url>
</urlset>النتيجة: غير صحيح — Invalid namespace. Expected "http://www.sitemaps.org/schemas/sitemap/0.9", got "http://www.sitemaps.org/schemas/sitemap/0.8"
sitemap غير صحيح (أولوية سيئة):
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page</loc>
<priority>1.5</priority>
</url>
</urlset>النتيجة: غير صحيح — URL #1: invalid <priority> — "1.5" (must be 0.0–1.0)
الميزات
- التحقق من صحة كلا نوعي sitemap
<urlset>و<sitemapindex> - فحص بنية XML واسم العنصر الجذر و namespace sitemaps.org
- التحقق من كل
<loc>للتأكد من وجوده وتنسيق URL صحيح - التحقق من
<lastmod>مقابل تنسيقات تاريخ W3C، و<changefreq>مقابل قائمة القيم المسموحة، و<priority>ضمن النطاق 0.0–1.0 - الإبلاغ عن الأخطاء لكل إدخال URL برقم الفهرس لسهولة التحديد
حالات الاستخدام
- قبل الإرسال إلى Google Search Console: تحقق من أن sitemap الخاص بك منظم بشكل صحيح حتى لا يتم رفضه أثناء الفهرسة.
- تصحيح أخطاء كود إنشاء sitemap: اكتشف المشاكل مثل عناصر
<loc>المفقودة أو namespaces خاطئة أو قيم أولوية خارج النطاق التي ينتجها CMS plugins أو البرامج النصية المخصصة. - التحقق من صحة ملفات فهرس sitemap: تأكد من أن إعداد sitemap متعدد يشير بشكل صحيح إلى sitemaps فرعية برابط URLs صحيحة.
كيفية عمله
تحلل الأداة النص المُلصق كـ XML باستخدام DOMParser المدمج في المتصفح. ثم تتحقق من:
- صحة XML — يتم الإبلاغ عن أي خطأ في التحليل حرفياً
- العنصر الجذر — يجب أن يكون
<urlset>أو<sitemapindex> - Namespace — يجب أن يكون بالضبط
http://www.sitemaps.org/schemas/sitemap/0.9 - قواعد لكل إدخال (لكل
<url>أو<sitemap>):<loc>: مطلوب، يجب أن يكون URL قابل للتحليل<lastmod>: اختياري؛ إذا كان موجوداً، يجب أن يطابق تنسيق W3C datetime (مثل2024-01-15أو2024-01-15T10:00:00Z)<changefreq>: اختياري؛ يجب أن يكون أحدalwaysأوhourlyأوdailyأوweeklyأوmonthlyأوyearlyأوnever<priority>: اختياري؛ يجب أن يكون رقماً بين 0.0 و 1.0
القيود
- يتم التحقق بالكامل في المتصفح — لا يتم إجراء طلبات HTTP خارجية، لذا يتم فحص عناوين URL في
<loc>للتنسيق فقط، وليس للوصول إليها. - لا يتحقق من امتدادات sitemap (صورة sitemap أو فيديو sitemap أو news sitemap) بما يتجاوز namespace الأساسي.
- حد أقصى لحجم الإدخال محدود بذاكرة المتصفح؛ قد تكون sitemaps الكبيرة جداً (100,000+ URLs) بطيئة في المعالجة.
الأسئلة الشائعة
هل تقوم هذه الأداة بجلب عناوين URL الخاصة بي للتحقق من عملها؟ لا. يتم إجراء كل التحقق محلياً في متصفحك. يتم فحص عناوين URL فقط للتنسيق الصحيح، وليس لحالة HTTP أو المحتوى.
ما تنسيقات <lastmod> المقبولة؟
أي تنسيق W3C datetime: YYYY أو YYYY-MM أو YYYY-MM-DD أو YYYY-MM-DDThh:mmTZD أو YYYY-MM-DDThh:mm:ssTZD.
يستخدم sitemap الخاص بي امتدادات الصور أو الفيديو — هل سيتم التحقق من صحتها؟
يتم التحقق من البنية الأساسية (namespace و <loc> وما إلى ذلك). لا يتم فحص العناصر من namespaces الامتدادات (صورة وفيديو وأخبار) ولكنها لن تسبب فشل التحقق.