Sitemaps: Entendendo e Contruindo !

Entendendo o Conceito de Sitemap

Sitemaps são arquivos presentes no servidor do seu site e que servem para indicar antecipadamente para os crawlers quando eles chegarem, quais são as URLs das suas páginas, ajudando no SEO. Crawlers como o Googlebot por exemplo, tem um tempo determinado máximo para ficar no seu site e indexar o conteúdo, ele até procura pelas URLs se não houver um sitemap presente, mas isso não é nenhuma vantagem já que esse tempo buscando as URLs é descontado do tempo total que ele vai ficar. Então é sempre vantajoso deixar um sitemap preparado para adiantar o trabalho dele.

É interessante lembrar que quanto mais importante vai se tornando o seu site ( mais Pagerank, mais visitas e mais tempo no ar ) mais tempo o Googlebot vai dedicando a ele e mais regularmente ele vai passando, mas mesmo assim, em geral os sites mais significativos tendem sempre a crescer de tamanho, o que acaba compensando esse ganho de tempo dando mais trabalho para o crawler, resumindo: na prática o Googlebot nunca vai ter tempo de ler o seu site todo, convém sempre dar uma força !!

Modo com que o crawler enxerga o seu site quando ele encontra e lê um sitemap:

Modo com que o crawler enxerga o seu site quando ele encontra um sitemap

Modo com que o crawler enxerga o seu site quando ele não encontra um sitemap:

Modo com que o crawler enxerga o seu site quando ele não encontra um sitemap

Informações Adicionais do Sitemap

Além de indicar para o crawler quais são e onde estão as suas páginas, os sitemaps ainda podem indicar algumas informações adicionais:

  • Importância das Páginas: Outra função interessante do sitemap é também informar a eles, qual a importancia que cada página tem. Isso é interessante pois assim o Googlebot e os outros crawlers vão saber quais páginas devem priorizar se não tiverem tempo de ler todas, caso contrário poderia ocorrer de páginas secundárias serem indexadas e as páginas principais ficarem de fora. A prioridade dada a cada página varia de 0 a 1, no caso representando 0% e 100%.
  • Frequência de Atualização: Indicando no sitemap a frequencia com que as suas páginas são atualizadas você ajuda os crawlers a entender melhor como você trabalha e atualiza o seu site. Entendendo como você atualiza fica mais facil pra eles montarem uma tabela de visitação eficiente.
  • Ultima Modificação: Esta informação em conjunto com a frequencia de atualização é util para ajudar os crawlers a planejar o proximo dia que vão voltar.

A Estrutura de Contrução do Sitemap

A estrutura de construção do sitemap foi padronizada esse ano e todos os principais crawlers a compreendem da mesma maneira. Ela é construida da seguinte maneira:

<url>
<loc>http://www.seusite.com.br/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>

Significado de cada tag no Sitemap:

  • <url>: Tag que indica que iniciamos um novo registro no sitemap
  • <loc>: Tag onde serão colocadas as URLs das páginas, sempre com o caminho completo, loc, no caso, vem de location ( localização ) .
  • <lastmod>: Tag que indica a ultima vez que a pagina indicada acima foi modificada, lastmod, vem do termo last modification ( última modificação )
  • <chancefreq>: Tag que tem como função indicar com que frequencia a dada página é alterada, podemos usar: daily, weekly e monthly, o nome da tag vem do termo change frequency ( frequência de atualização )
  • <priority>: Tag que indica para o crawler a importância da página, o valor válido varia de 0 a 1. O valor de 0.8 do exemplo indica que a página, tem importância de 80%, uma importância alta no caso. Prority significa prioridade.

A Localização do Sitemap

Assim como os crawlers procuram pelas suas páginas se não encontram um sitemap, eles também procuram um pouco pelo sitemap se não acham ele logo de cara. O primeiro lugar onde os crawlers procuram e local padrão para deixar o seu sitemap é a raiz do site. Caso você por algum motivo planeje deixar seu sitemap em outro lugar, não esqueça de indicar esse local no robots.txt. A propósito, o robots.txt, ao contrário do sitemap e das URLs não é procurado pelos crawlers, se ele não estiver na raiz do site, os crawlers pressupõe que ele não existe. Por enquanto é isso aí, até a semana que vem, abraços !!


Artigos Relacionados aos Temas: Crawlers e googlebot

Googlebot: Afinal, o que ele tem a ver com meu site ?

Todos os dias centenas de milhares de sites saem e entram no ar na Internet, como é possivel acompanhar isso tudo ? Como o Google obtem as informações do meu...

Plugin desenvolvido pela Equipe MundoSEO.

E Você ? Quer Mais Resultados para o seu Site ou Blog ? Conheça os Nossos Serviços de SEO:

Comentários:

1 Ygor sarkis no dia 07/12/08 às 13:33 disse:

Parabens pela clareza!

2 Alexandre no dia 17/12/08 às 8:55 disse:

Parabéns, pra mim sitemaps era só um arquivo txt com as urls.

Deixe um comentário