Robots.txt वैलिडेटर
robots.txt नियमों के विरुद्ध URLs को वैलिडेट करें। जांचें कि कोई URL विशिष्ट यूज़र-एजेंट्स के लिए अनुमति है या नहीं, क्रॉल डिले देखें, और साइटमैप रेफ़रेंसेज़ खोजें।
इनपुट
आउटपुट
रीडमी
robots.txt क्या है?
robots.txt एक टेक्स्ट फ़ाइल है जिसे वेबसाइटें अपनी रूट डायरेक्टरी में रखती हैं ताकि वे वेब क्रॉलर्स और सर्च इंजन बॉट्स के साथ संवाद कर सकें। यह फ़ाइल स्वचालित विज़िटर्स को बताती है कि साइट के कौन‑से पेज या सेक्शन तक वे पहुँच सकते हैं या नहीं। यह फ़ाइल Robots Exclusion Protocol का पालन करती है, जो साइट मालिकों को यह नियंत्रित करने में मदद करता है कि उनका कंटेंट सर्च इंजनों द्वारा कैसे इंडेक्स किया जाए और वेब स्क्रैपर्स द्वारा कैसे एक्सेस किया जाए।
जब कोई सर्च इंजन बॉट वेबसाइट पर जाता है, तो वह पहले robots.txt फ़ाइल की जाँच करता है। इस फ़ाइल में दिए गए निर्देशों के आधार पर बॉट जानता है कि क्या वह विशिष्ट URL को क्रॉल कर सकता है, अनुरोधों के बीच कितना विलंब होना चाहिए, और अधिक कुशल क्रॉलिंग के लिए XML sitemaps कहाँ मिलेंगे।
उपकरण विवरण
Robots.txt Validator एक ऑनलाइन टूल है जो आपको यह परीक्षण और सत्यापित करने में मदद करता है कि robots.txt नियम विशिष्ट URL पर कैसे लागू होते हैं। यह robots txt पार्सर आपको robots.txt सामग्री पेस्ट करने, जांचने के लिए एक URL दर्ज करने, और एक user-agent (जैसे Googlebot, Bingbot, या सभी बॉट्स के लिए वाइल्डकार्ड “*”) निर्दिष्ट करने की सुविधा देता है। Robots txt validator टूल तुरंत बताता है कि निर्दिष्ट crawler के लिए वह URL अनुमति प्राप्त है या प्रतिबंधित, जिससे आप उत्पादन में लागू करने से पहले अपने robots txt फ़ाइल का आसानी से परीक्षण कर सकते हैं।
विशेषताएँ
- URL वैलिडेशन: robots.txt नियमों के अनुसार किसी विशिष्ट URL को एक निर्धारित user-agent के लिए एक्सेस किया जा सकता है या नहीं, यह जांचें
- User-Agent परीक्षण: एक ही URL के खिलाफ विभिन्न user-agents (सर्च इंजन बॉट्स) का परीक्षण करें
- ऑनलाइन पार्सर: इस robots txt validator को ऑनलाइन उपयोग करें, बिना किसी इंस्टॉलेशन या रजिस्ट्रेशन के
- Crawl Delay डिटेक्शन: यदि robots.txt फ़ाइल में crawl delay सेट किया गया है तो उसे स्वचालित रूप से दिखाता है
- Sitemap डिस्कवरी: robots.txt फ़ाइल में संदर्भित सभी sitemap URL दिखाता है
- रियल‑टाइम पार्सिंग: जैसे ही आप robots.txt सामग्री टाइप या संशोधित करें, तुरंत वैलिडेशन प्राप्त करें
- स्पष्ट परिणाम: विज़ुअल इंडिकेटर्स के माध्यम से दिखाता है कि एक्सेस अनुमति प्राप्त है या प्रतिबंधित
उपयोग के मामले
- SEO पेशेवर: यह सुनिश्चित करें कि महत्वपूर्ण पेज अनजाने में सर्च इंजनों से ब्लॉक न हों और उत्पादन में जाने से पहले अपने robots txt फ़ाइल का परीक्षण करें
- वेब डेवलपर: उत्पादन में डिप्लॉय करने से पहले robots.txt कॉन्फ़िगरेशन का परीक्षण करने के लिए इस robots txt validator टूल का उपयोग करें
- कंटेंट मैनेजर: यह सुनिश्चित करें कि वेबसाइट के विशिष्ट सेक्शन क्रॉलर्स के लिए सही तरीके से संरक्षित या उजागर हों
- साइट ऑडिटर: लाइव वेबसाइट तक पहुँचे बिना यह जल्दी जाँचें कि कोई URL क्रॉल किया जा सकता है या नहीं
- बॉट मैनेजमेंट: विभिन्न सर्च इंजन क्रॉलर्स के लिए विभिन्न नियमों को कॉन्फ़िगर और परीक्षण करें