Sitemaps: Entendendo e Contruindo !

Por Vinicius Paes - 26 set 2008

Sitemaps são arquivos presentes no seu site e que servem para indicar antecipadamente para os crawlers quais são e onde estão as suas páginas. Entenda como eles funcinam e aprenda a fazer um.

Entendendo o Conceito de Sitemap

Sitemaps são arquivos presentes no servidor do seu site e que servem para indicar antecipadamente para os crawlers quando eles chegarem, quais são as URLs das suas páginas, ajudando no SEO. Crawlers como o Googlebot por exemplo, tem um tempo determinado máximo para ficar no seu site e indexar o conteúdo, ele até procura pelas URLs se não houver um sitemap presente, mas isso não é nenhuma vantagem já que esse tempo buscando as URLs é descontado do tempo total que ele vai ficar. Então é sempre vantajoso deixar um sitemap preparado para adiantar o trabalho dele.

É interessante lembrar que quanto mais importante vai se tornando o seu site ( mais Pagerank, mais visitas e mais tempo no ar ) mais tempo o Googlebot vai dedicando a ele e mais regularmente ele vai passando, mas mesmo assim, em geral os sites mais significativos tendem sempre a crescer de tamanho, o que acaba compensando esse ganho de tempo dando mais trabalho para o crawler, resumindo: na prática o Googlebot nunca vai ter tempo de ler o seu site todo, convém sempre dar uma força !!

Modo com que o crawler enxerga o seu site quando ele encontra e lê um sitemap:

Modo com que o crawler enxerga o seu site quando ele encontra um sitemap

Modo com que o crawler enxerga o seu site quando ele não encontra um sitemap:

Modo com que o crawler enxerga o seu site quando ele não encontra um sitemap

Informações Adicionais do Sitemap

Além de indicar para o crawler quais são e onde estão as suas páginas, os sitemaps ainda podem indicar algumas informações adicionais:

  • Importância das Páginas: Outra função interessante do sitemap é também informar a eles, qual a importancia que cada página tem. Isso é interessante pois assim o Googlebot e os outros crawlers vão saber quais páginas devem priorizar se não tiverem tempo de ler todas, caso contrário poderia ocorrer de páginas secundárias serem indexadas e as páginas principais ficarem de fora. A prioridade dada a cada página varia de 0 a 1, no caso representando 0% e 100%.
  • Frequência de Atualização: Indicando no sitemap a frequencia com que as suas páginas são atualizadas você ajuda os crawlers a entender melhor como você trabalha e atualiza o seu site. Entendendo como você atualiza fica mais facil pra eles montarem uma tabela de visitação eficiente.
  • Ultima Modificação: Esta informação em conjunto com a frequencia de atualização é util para ajudar os crawlers a planejar o proximo dia que vão voltar.

A Estrutura de Contrução do Sitemap

A estrutura de construção do sitemap foi padronizada esse ano e todos os principais crawlers a compreendem da mesma maneira. Ela é construida da seguinte maneira:

<url>
<loc>http://www.seusite.com.br/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>

Significado de cada tag no Sitemap:

  • <url>: Tag que indica que iniciamos um novo registro no sitemap
  • <loc>: Tag onde serão colocadas as URLs das páginas, sempre com o caminho completo, loc, no caso, vem de location ( localização ) .
  • <lastmod>: Tag que indica a ultima vez que a pagina indicada acima foi modificada, lastmod, vem do termo last modification ( última modificação )
  • <chancefreq>: Tag que tem como função indicar com que frequencia a dada página é alterada, podemos usar: daily, weekly e monthly, o nome da tag vem do termo change frequency ( frequência de atualização )
  • <priority>: Tag que indica para o crawler a importância da página, o valor válido varia de 0 a 1. O valor de 0.8 do exemplo indica que a página, tem importância de 80%, uma importância alta no caso. Prority significa prioridade.

A Localização do Sitemap

Assim como os crawlers procuram pelas suas páginas se não encontram um sitemap, eles também procuram um pouco pelo sitemap se não acham ele logo de cara. O primeiro lugar onde os crawlers procuram e local padrão para deixar o seu sitemap é a raiz do site. Caso você por algum motivo planeje deixar seu sitemap em outro lugar, não esqueça de indicar esse local no robots.txt. A propósito, o robots.txt, ao contrário do sitemap e das URLs não é procurado pelos crawlers, se ele não estiver na raiz do site, os crawlers pressupõe que ele não existe, então não deixe de inserí-lo em seu site para aumentar o nível de adequação para Otimização de Sites. Por enquanto é isso aí, até a semana que vem, abraços !!

Sobre o Autor:
Autor
Mestre em Ciência e Tecnologia da Computação pela Universidade Federal de Itajubá, e fascinado pelo desenvolvimento em diversas tecnologias web. É possível encontrá-lo pelo Twitter, Facebook e Google+.

14 Comentários

  1. Ygor sarkis disse:

    Parabens pela clareza!

  2. Alexandre disse:

    Parabéns, pra mim sitemaps era só um arquivo txt com as urls.

  3. Átila disse:

    duvida, idiota mais e uma duvida…
    o sitemap eu coloco em um arquivo txt ou dentro de cada pagina?

  4. Valden Flavio disse:

    Fala Átila
    Imagina cara !! Nenhuma dúvida é idiota, vivendo e aprendendo !!
    O sitemap ele deve ficar em um arquivo a parte chamado sitemap.xml ( sim, o nome é padrão ) deste modo fica mais facil pro Googlebot encontrar e processar o arquivo. Tecnicamente este arquivo pode ficar em qualquer lugar, mas recomendamos coloca-lo na raiz do site.

  5. NOSSA….leio isso e me sinto uma BURRA, sem querer ofender os de quatro patas, claro.

    Estou lá olhando o meu Ferramentas para o Webmastes e a frase
    Envie um Sitemap para informar ao Google sobre as páginas em seu site que não conseguiremos encontrar e fico olhando aquela caixa branca depois do url do meu blog e NÃO sei o que fazer………..rsrs

    seria o tal do “seria cômico se não fosse trágico”….rs

  6. Cara, muito bom seu artigo! parabéns!

  7. Valden Flavio disse:

    Olá Arte!
    É mais simples do que você imagina! Basta fazer uma página que contenha link para todas as demais de forma organizada. Se utilizar uma estrutura de blog, existe vários plugins automáticos para gerar o sitemap. Simples e Objetivo! A submissão do sitemap é uma ótima prática de SEO e Otimização de Sites!

  8. Valden Flavio disse:

    Olá Adriano!
    Fico muito feliz pela satisfação com o artigo! Volte sempre e acompanhe dicas frescas de Otimização de Sites e SEO!
    Abraços!

  9. Sr Edy disse:

    voces tem um link para que possa incluir o sitemaps dentro do google o meu site e novo quem pode me ajudar

  10. Sr.Edy disse:

    por favor me responda esta pergunta e muito importante para mim ok veja eu coloquei o sitemap dentro do google esta certo ou errado pois voce me deixo em uma duvida grande veja abaixo por favor

    recomendamos coloca-lo na raiz do site.

    como posso fazer isto?

    aguardo uma resposta
    Sr.Edy

  11. Elaine disse:

    Para cada pagina do meu site preciso criar um arquivo .xml e colocar na raiz, ou posso incluir todas paginas num unico sitemap.xml?

  12. Diego disse:

    Até agora o melhor artigo explicando o que é sitemap que eu li. mas veja se você pode me ajudar.

    Depois que eu coloquei um sitemap no meu blog, as visitas vindas do google cairam, e muito. De uma média de 700/dia, despencou para 250/dia.

    Sabe me dizer qual é o problema, e como posso soluciona-lo?

  13. aluysio disse:

    Olá Vinicius. Você acha que é válido usar o site map para indicar ao Google que uma página é mais importante que a outra e assim evitar a canibalização de palavras-chave em meu site?

  14. Caramba! quanta informção util e clara ! que bom encontrar gente assim! seu site foi favoritado, foi pro open e ja vou divulgando!!!

Deixe o seu comentário!