Mundo SEO - Otimização de Sites e SEO


Canonização de URL: evitando conteúdo duplicado com o .htaccess

O que é canonização de URL?

Canonização de URL pode ser definida como os endereços redundantes para a mesma página, um exemplo bem simples permite entender o significado:
Poderíamos ter acesso para o site do mundo SEO pelas seguintes maneiras:

www.mundoseo.com.br
http://mundoseo.com.br
www.mundoseo.com.br/index.html
http://mundoseo.com.br/index.php

Porém todas levam para a página principal do site. Assim os mecanismos de busca aos acessarem os links, terão acessos redundantes ao mesmo conteúdo, caracterizando conteúdo duplicado. Sendo o site penalizado, pois esta é uma técnica black hat.

Desta maneira é interessante editar o .htaccess do seu site, para encaminhar os mecanismos de busca para o endereço correto. Além de ser uma boa prática de SEO e otimização de sites , pois podemos definir o melhor endereço para o mesmo.

Como faço para evitar o conteúdo duplicado?

É necessário ter acesso de administrador ao conteúdo do site, podendo editar os arquivos de configuração, no caso, o arquivo de configuração do servidor apache: “.htaccess” .

htaccess - canonização de url

A edição do mesmo é bem simples, basta abrir o bloco de notas para começar. Insira o código abaixo, substituindo o nome (meu_site), para o do seu site:

RewriteCond %{HTTP_HOST} ^(meu_site\.com\.br)(:80)? [NC]
RewriteRule ^(.*) http://www.meu_site.com.br/$1 [R=301,L]

Processo finalizado, seu site já está protegido contra conteúdo duplicado que poderia ser ocasionado pelo WWW contra no-WWW.

Artigos Relacionados aos Temas: canonização de URL e htaccess

htaccess: Tudo o que Você Precisa Saber e mais um Pouco

O htaccess é um arquivo de configuração de acesso do servidor Apache. Com ele é possível configurar várias funções de acesso dos usuários a um diretório específico e atrbuir estas regras aos subdiretórios subsequentes. Sendo a utilização de alguns parâmetros de configuração fortemente recomendado para otimização de sites.

Comentários:

1 Rubens Machado no dia 09/07/08 às 22:56 disse:

Por todo lado que procurei falando do .htaccess só explicam a sua função, mas não ensinam nenhuma prática. Consegui editar o meu agora, e o red 301 tá funcionando. Valeu cara!

2 Fábio Almeida no dia 11/07/08 às 11:49 disse:

Fala cara, tive alguns problemas utilizando o .htaccess no meu site. Queria saber se você não teria um código mais detalhado que até mesmo utilizasse o htpassword?
Mas o post tá ótimo! Parabéns!

3 Vagner Carvalho no dia 11/07/08 às 11:59 disse:

Fala Fábio, o código acima realmente é um código básico pro .htaccess. É possível habilitar diversas outras funçoes. Realmente o htpasswd é muito útil para bloqueio de conteúdo com senha, que acredito que seja seu desejo. Segue um código mais completo:

deny from all

Options -Indexes
AuthUserFile /home/conteudo_protegido/.htpasswd
AuthGroupFile /dev/null
AuthName “Please enter your ID and password”
AuthType Basic
require valid-user
ErrorDocument 400 bad-request.php
ErrorDocument 401 pass.php
ErrorDocument 402 dolar.php
ErrorDocument 403 deny.php
ErrorDocument 404 404.php
RewriteEngine on
RewriteCond %{HTTP_HOST} ^(seu_site\.com\.br)(:80)? [NC]
RewriteRule ^(.*) http://www.seu_site.com.br/$1 [R=301,L]
DirectoryIndex index.php
order deny,allow

Qualquer dúvida só falar
Abraços

4 Olavo Mello no dia 20/03/09 às 2:50 disse:

Vagner,

tudo joia. Cheguei até sei artigo pois estou com uma dúvida referente á utilização do .htaccess e gostaria de uma ajuda, se possível.

Estou utilizando a estrutura completa para gerar urls amigáveis porém minhas imagens utilizam o caminho relativo e por este motivo tenho que inserir o comando de redirecionamento na url do htaccess. [R=301,L]

Minhas dúvidas são:

1) Isto irá prejudicar o SEO do site visto que a url exibida é do tipo

/index.php?pagina=3790&sid=criacao-de-sites.html

e não

/3790/criacao-de-sites.html

?

2 ) Retirando o comando citado consigo o resultado que procuro porém as imagens das páginas desaparecem pois utilizam o comando como se fosse parte do endereço das imagens. ( imagens, swf, etc ). Existe alguma solução para resolver este problema ?

Agradeço desde já e parabéns pelo artigo.

5 Vagner Carvalho no dia 21/05/09 às 11:53 disse:

Fabio!
Há um outro artigo exemplificando a utilização do htpassword. Dependendo de seu servidor, creio que não será possível a utilização do mesmo.
Abraços

6 Vagner Carvalho no dia 21/05/09 às 12:01 disse:

Olá Olavo!
Sugiro utilizar URL amigáveis em seu web site, para evitar problemas de indexação. Se possível especificar como está fazendo a geração das mesmas, poderia auxiliá-lo de maneira mais direcionada. É mais vantajoso utilizar url absoluta nas imagens, para evitar os problemas, e manter a estrutura do web site de forma otimizada. Desta forma garante uma ótima Otimização de Site e SEO !
Abraços

Deixe um comentário