Conteúdo Duplicado: Black Hat e Encrenca em Dobro

Por Vinicius Paes - 29 ago 2008

Uma técnica muito comum entre blogueiros, webmasters e profissionais de SEO adeptos do Black Hat é o chamado Conteúdo Duplicado. Entenda o que é conteúdo duplicado, as suas desvantagens e como evitá-lo no nosso tutorial de SEO.

Afinal, o que é Conteudo Duplicado ?

Uma técnica muito comum entre blogueiros, webmasters e profissionais de SEO ( Otimização de Sites ) adeptos do Black Hat ( Black Haters ) é o chamado Conteúdo Duplicado. Duplicar conteúdo basicamente nada mais é do que pegar uma página de um site ou um artigo de um blog que tenham um conteúdo relevante e copia-los para o seu site ou blog como se você que tivesse escrito. O Google não revela qual a porcentagem do texto de uma página que deve ser copiada ( mais uma vez para evitar a criação de táticas avançadas de black hat ), mas estudos e testes comprovam que algumas poucas linhas já bastam.

Principais Tipos de Conteúdo Duplicado

Conteúdo Duplicado: Nem sempre o resultado é igual ao original...

Uma informação importante que pouca gente sabe é que não é só no corpo do texto que o conteúdo duplicado acontece, copiar meta-description tags, title tags ( títulos ) ou meta keyword tags de outros sites também é um caso deste black hat. Além disso há alguns outros casos interessantes em que o conteúdo duplicado pode ser gerado automaticamente ( sem que o webmaster perceba ):

  • Case Sensitive: muita gente desconhece o fato de que as URLs são case sensitive, ou seja, as letras maiúsculas e minusculas são importantes. Por exemplo você pode usar URLs do tipo “www.meusite.com.br/compre-agora.php” e “www.meusite.com.br/Compre-Agora.php” em pontos diferentes do site sem perceber, qualquer pessoa que ler estas 2 URLs claramente vai saber que são a mesma página, no entanto para o Googlebot e os crawlers em geral que são programas isso não fica claro, já que ele conseguiu chegar na tal página de dois modos diferentes através de 2 URLs distintas, ele vai pensar que se tratam de duas páginas diferentes com o conteúdo exatamente igual.
  • URLs não Canonizadas: Outro caso em que conteúdo duplicado é gerado sem consentimento dos desenvolvedores é o caso das URLs com e sem o www. Da mesma forma que foi dito acima, se o Googlebot consegue chegar na sua home page através dos endereços “www.meusite.com.br” ou então “meusite.com.br” ele vai considerar que são novamente dois sites diferentes ( já que as URLs são diferentes ) ou então duas páginas do seu site com o conteúdo idêntico, para evitar que o Googlebot tenha este comportamento o seu htaccess pode ser configurado para canonizar as suas URLs.

Desvatagens do Conteúdo Duplicado

Além é claro do risco do seu site ser punido e perder algumas posições no ranking por copiar conteúdo de outros ( caso do uso do Conteúdo Duplicado como Black Hat ), há algumas outras desvantagens de se ter conteúdo duplicado no seu site ( acidental ou não ):

  • Competição Desnecessária: Se duas páginas do seu próprio site estiverem duplicadas ( devido a algum dos fatores apontados acima por exemplo ), você só tem a perder pois estas páginas vão começar a competir entre sí e ambas vão perder ranking.
  • Desperdicio de Tempo de Indexação: O Googlebot dependendo do tamanho do seu site, tem um determinado tempo fixo ( as vezes insuficiente para indexar o site todo ) para poder ler e indexar o seu site. Se você proporicionar que ele chegue a uma ou mais páginas através de URLs diferentes ele pode perder tempo indexando mais de uma vez a mesma página pensando se tratar de outra.

Conteúdo Duplicado: Seja Criativo, mas não copie...

Algumas Curiosidades sobre o Conteúdo Duplicado

Uma pergunta que muitos fazem: então quer dizer que não podemos citar trechos de outros sites interessantes de outros sites por que é perigoso cairmos sem querer no filtro de Black Hat do Google ? Não, não é bem assim.. Há uma tática que podemos utilizar para deixar claro que não estamos fazendo Black Hat: usar Blockquotes. Blockquotes são tags HTML que pouquissima gente conhece ( <blockquote> citação de outro site ou blog… </blockquote> ). Usar o texto dentro de uma blockquote indica explicitamente ao crawler que você está fazendo uma citação. Claro, não vá abusar da boa vontade do pobre Googlebot botando um artigo inteiro dentro de outro site dentro de Blockquotes ( aposto que algumas mentes black hat já pensaram nisso.. ), dependendo da quantidade de texto colocado o filtro de black hat é sim ativado.

Outra curiosidade que muitos tem: existem conteúdo duplicado em texto de linguas diferentes: a resposta é sim. Se você copiar um texto de um site ou blog em inglês exatemante do jeitinho que ele é no seu site traduzindo para o português você tem uma grande chance de ser pego. O Google em especial vem sempre desenvolvendo ferramentas de tradução, como o Google Translate, ferramantas essas que além de poderem ser usadas pelos usuários para traduzir textos também sempre são incorporadas ao Googlebot para ele poder detectar black hats desse tipo.

Por fim nossa dica para você que produz conteúdo para blogs ou sites é simples e bem manjada: seja criativo, traga coisas novas, conteúdo original. Não faz mau se você se basear em outros artigos para produzir os seus ( isso é feito desde a invenção da escrita ), só não esqueça de citar as suas fontes. Por enquanto é isso qualquer dúvida é só comentar ! Abraços !!

Sobre o Autor:
Autor
Mestre em Ciência e Tecnologia da Computação pela Universidade Federal de Itajubá, e fascinado pelo desenvolvimento em diversas tecnologias web. É possível encontrá-lo pelo Twitter, Facebook e Google+.

7 Comentários

  1. Wilcasoli disse:

    Primeiramente parabéns pelo artigo. Eu já conhecia a tag <blockquote> mas nunca precisei usar e também não sabia bem o que ela fazia. Eu tenho uma dúvida:
    No site em que eu trabalho, são postados regularmente notícias jurídicas que são buscadas em outros sites (com a fonte da notícia). Estou fazendo Black Hat? Como faço para evitar isso?
    Agradeço a sua ajuda.

  2. Lucas Souza disse:

    Boa Noite Wilcasoli

    Que bom que você está gostando do nosso trabalho 🙂

    No caso do seu site, se você estiver copiando conteúdos de páginas inteiras, infelizmente você pode ser enquadrado sim no Black Hat de Conteúdo Duplicado, já que não foi você que produziu as notícias.

    Colocar < blockquotes > em todo o texto também não iria adiantar pois esta tag só é válida quando usada em pequenos blocos de texto.

    No seu caso específico, na minha opinião a melhor sugestão para evitar o Conteúdo Duplicado, seria colocar apenas trechos destas noticias no seu site e citar a fonte para que a pessoa leia na integra o original.

    Espero ter me expressado bem e respondido sua pergunta. Abraços !

  3. Daniel Gomes disse:

    Olá. Gostaria de tirar uma dúvida. Recentemente tive 2 posts copiados por outros blogs. Mas estes blogs me linkaram como referência. Meu blog sai prejudicado de alguma forma, mesmo com estes blogs indicando meu blog como fonte?

    Obrigado.

  4. Lucas Souza disse:

    Olá Daniel, de forma alguma seu blog será prejudicado. Primeiramente que, ao postar um artigo, dependendo da ferarmenta de postagem utilizada, ela vincula o conteúdo para seu site em sites de notificação de publicação. Assim na hora de indexação os motores de busca saberão que seu conteúdo é o original. Além disso, os outros sites fizeram referência a fonte do material postado. Assim o motor de busca também irá entender o processo como uma ação de marketing.

  5. Daniel Gomes disse:

    Obrigado Lucas, isso foi um alívio!

    O feed do Mundo SEO já está no meu reader.

    Abraço!

  6. Lucas Souza disse:

    Grande Daniel!
    Obrigado pela visita! Não deixe de expressar qualquer dúvida referente ao assunto! Estamos sempre a disposição de auxílio mútuo para uma seriedade na web e uma Otimização de Sites eficiente!

  7. Alexandre disse:

    Realmente, tenho categorias em meu site que podem estar em conflito pensando dessa forma. Vou com certeza alterar alguns conteúdos, mas tenho problemas reais com sitemaps, o google reconhece meu sitemap, mas não reconhece nunhum link importante de meu site.

    Isso daria um bom artigo futuro, ou já existe?

    Parabéns pela matéria!

Deixe o seu comentário!