O que é um sitemap XML?

Um sitemap XML é um arquivo estruturado que informa aos mecanismos de busca quais páginas de um site estão disponíveis para rastreamento. Ele segue um protocolo definido pelo Google, Bing, Yahoo e Ask.com em sitemaps.org, e utiliza um formato XML padrão com um namespace específico. Os sitemaps ajudam os mecanismos de busca a descobrir conteúdo de forma mais eficiente — especialmente para sites grandes, páginas novas ou páginas com poucos links de entrada.

Existem dois tipos de arquivos de sitemap: um conjunto de URLs (<urlset>), que lista URLs individuais, e um índice de sitemap (<sitemapindex>), que agrupa múltiplos arquivos de sitemap. Ambos devem estar em conformidade com o mesmo namespace e regras estruturais para serem reconhecidos pelos mecanismos de busca.

Descrição da ferramenta

Esta ferramenta valida arquivos XML de sitemap diretamente a partir de uma entrada de texto. Cole seu sitemap XML e a ferramenta verifica instantaneamente se ele está em conformidade com o padrão sitemaps.org. Ela verifica a estrutura XML, o elemento raiz, o namespace e todos os elementos filhos — relatando quaisquer problemas com mensagens de erro precisas, incluindo o número da URL afetada.

Exemplos

Sitemap urlset válido:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2024-01-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://example.com/about</loc>
    <changefreq>yearly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

Resultado: Válido — Tipo: Conjunto de URLs, Contagem de URLs: 2


Sitemap inválido (namespace incorreto):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.8">
  <url>
    <loc>https://example.com/</loc>
  </url>
</urlset>

Resultado: InválidoNamespace inválido. Esperado "http://www.sitemaps.org/schemas/sitemap/0.9", obtido "http://www.sitemaps.org/schemas/sitemap/0.8"


Sitemap inválido (prioridade incorreta):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/page</loc>
    <priority>1.5</priority>
  </url>
</urlset>

Resultado: InválidoURL #1: <priority> inválida — "1.5" (deve estar entre 0.0–1.0)

Recursos

  • Valida ambos os tipos de sitemap <urlset> e <sitemapindex>
  • Verifica a sintaxe XML, o nome do elemento raiz e o namespace sitemaps.org
  • Valida cada <loc> quanto à presença e formato de URL bem formado
  • Verifica <lastmod> em relação aos formatos de data W3C, <changefreq> em relação à lista de valores permitidos e <priority> dentro do intervalo 0.0–1.0
  • Relata erros por entrada de URL com números de índice para localização fácil

Casos de uso

  • Antes de enviar para o Google Search Console: verifique se seu sitemap está estruturado corretamente para não ser rejeitado durante a indexação.
  • Depuração de código de geração de sitemap: detecte problemas como elementos <loc> ausentes, namespaces incorretos ou valores de prioridade fora do intervalo produzidos por plugins de CMS ou scripts personalizados.
  • Validação de arquivos de índice de sitemap: confirme que uma configuração de múltiplos sitemaps referencia corretamente sitemaps filhos com URLs válidas.

Como funciona

A ferramenta analisa o texto colado como XML usando o DOMParser integrado do navegador. Em seguida, verifica:

  1. Bem-formação XML — qualquer erro de análise é relatado literalmente
  2. Elemento raiz — deve ser <urlset> ou <sitemapindex>
  3. Namespace — deve ser exatamente http://www.sitemaps.org/schemas/sitemap/0.9
  4. Regras por entrada (para cada <url> ou <sitemap>):
    • <loc>: obrigatório, deve ser uma URL analisável
    • <lastmod>: opcional; se presente, deve corresponder ao formato de data/hora W3C (por exemplo, 2024-01-15 ou 2024-01-15T10:00:00Z)
    • <changefreq>: opcional; deve ser um de always, hourly, daily, weekly, monthly, yearly, never
    • <priority>: opcional; deve ser um número entre 0.0 e 1.0

Limitações

  • A validação é executada inteiramente no navegador — nenhuma solicitação HTTP externa é feita, portanto, as URLs em <loc> são verificadas apenas quanto ao formato, não quanto à acessibilidade.
  • Não valida extensões de sitemap (sitemap de imagem, sitemap de vídeo, sitemap de notícias) além do namespace principal.
  • O tamanho máximo de entrada é limitado pela memória do navegador; sitemaps muito grandes (100.000+ URLs) podem ser lentos para processar.

Perguntas frequentes

Esta ferramenta busca minhas URLs para verificar se funcionam? Não. Toda a validação é feita localmente no seu navegador. As URLs são verificadas apenas quanto ao formato correto, não quanto ao status HTTP ou conteúdo.

Quais formatos <lastmod> são aceitos? Qualquer formato de data/hora W3C: YYYY, YYYY-MM, YYYY-MM-DD, YYYY-MM-DDThh:mmTZD ou YYYY-MM-DDThh:mm:ssTZD.

Meu sitemap usa extensões de imagem ou vídeo — essas serão validadas? A estrutura principal (namespace, <loc>, etc.) é validada. Elementos de namespaces de extensão (imagem, vídeo, notícias) não são verificados, mas não causarão falha na validação.