Evite fim da linha para o googlebot!

Vimos o perfil de como o googlebot navega pela internet, devemos então evitar certas circunstâncias para assim melhorar a otimização de sites. Devemos evitar então 2 pontos-chave: páginas orfãs, e páginas sem-saída.

Páginas Órfãs

Páginas Orfãs são aquelas que não tem ligação com nenhuma outra página do site. (não é encontrada por nenhum link do site). Desta forma o robô de busca não consegue encontrá-la, a não ser que haja um link externo para a mesma. É possível que haja uma ocorrência como essa, quando é criada uma página privada, ou mesmo por acidente no desenvolvimento.

Há um famoso tabu nesta área, caso um mecanismo de busca encontre uma página como essa, a mesma é tratada como um doorway page, na qual seria uma técnica black hat SEO, e o site seria penalizado.

A pior coisa que sobre as páginas órfãs é que elas são inúteis para SEO, pois não podem ser vistas pelos mecanismos de pesquisa.

Páginas Sem-saída

ERRO 404 - página não encontrada

Páginas sem-saída (dead end page), são aquela que não tem nenhum link apontado para qualquer outro lugar, criando um “fim-da-linha”. Definitivamente não é o melhor caso, é uma ocorrência não natural nos padrões de desenvolvimento, pois uma página web deve ser ligada a outra página. Desta maneira o robô-de-busca fica sem muita opção, assim como o usuário da página: não tem para onde ir, abandonam o site.

Com a utilização de recursos disponíveis na estruturação de páginas web, como utilização de templates disponíveis na internet, é muito difícil a ocorrência de uma página sem-saída. ( sempre haverá um link no footer, header ou na sidebar). Um caso comum de página sem-saída são as páginas 404. Lembrando que há possibilidade de configurar as páginas de erro, para que sejam otimizadas, sendo uma ótima prática de SEO.

Como otimizo minha página 404?

Fim da linha para o googlebot, dead end page

É possível otimizar sua página 404 com o arquivo .htaccess, basta criar uma página padrão para quando for solicitado uma página que não exista no site. Desta maneira, sempre que não for encontrado um endereço relativo ao seu site, será redirecionado para sua página de erro. Esta podendo estar otimizada com vários links, melhotando ainda mais o SEO. Segue exemplo de um trecho do arquivo .htaccess com a página 404 padrão com o nome: “minhapagina404.html”
<Files ~ “^.(htaccess|htpasswd)$”>

deny from all

</Files>

ErrorDocument 404 minhapagina404.html

order deny,allow