Como utilizar a meta tag robots e como o Googlebot a interpreta

Saiu no Official Google Webmaster Central Blog um artigo intitulado como Using the robots meta tag falando a respeito da utilização da meta tag robots e como o Googlebot a interpreta. Vale a leitura.

Para aqueles que não dominam o inglês, vou simplificar o artigo linkado acima em alguns exemplos. Uma meta tag do tipo robot é criado da seguinte maneira:

<meta name="robots" content="Veja Valores abaixo" />

  • NOINDEX – previne a página de ser indexada pelo Googlebot*;
  • NOFOLLOW – previne o Googlebot de indexar qualquer link contigo na página;
  • NOARCHIVE – previne que uma cópia da página seja disponibilizada no resultado da busca;
  • NOSNIPPET – previne a descrição da página no resultado da busca bem como o cache dela;
  • NOODP – bloqueia a descrição da página utilizada no resultado da busca no Open Directory Project;
  • NONE – o mesmo que “NOINDEX, NOFOLLOW”.

* Googlebot

8 ideias sobre “Como utilizar a meta tag robots e como o Googlebot a interpreta

  1. Ae leandro,

    Aproveitando o assunto, deixa eu te perguntar uma coisa que já pesquisei pesquisei, perguntei, consultei e não achei a resposta.

    Você sabe comé que coloca-se links de categorias abaixo de nosso link no google? Assim como os caras do tableless.com.br fazem: http://www.google.com.br/search?q=tableless

    Veja que abaixo do link deles tem “artigos e estudos”, “bonito de se ver”, etc…

    E ae, sabe?

  2. Cara, não sei ao certo. Acredito que é pelo fato deles utilizarem o serviço AdWord, e provavelmente há uma integração.

    Será?

  3. Micox,

    A resposta simples seria PageRank alto incluindo as páginas internas.

    E ela funciona quando você procura pelo domínio ou um termo muito forte da página como nome de produto.

    Grande abraço,

  4. Olá Paulo,

    Interessante observação.

    Agora, quanto ao PageRank alto seria o valor de cada página ou a soma deles? Fiz uma breve pesquisa aqui e o PageRank de cada página listada são os seguintes:

    * http://www.tableless.com.br/ (6/10)
    * http://www.tableless.com.br/aprenda/ (4/10)
    * http://www.tableless.com.br/categorias/bonito-de-se-ver/ (2/10)
    * http://www.tableless.com.br/categorias/desenvolvimento/video-tutorial/ (1/10)
    * http://tableless.com.br/aprenda/ (5/10)

    Fato interessante, o google considera http://www.tableless.com.br/aprenda/ como uma URL e http://tableless.com.br/aprenda/ como outra. Por que não considerar apenas uma?

    Outro fato, se a ordenação das páginas exibidas forem o PageRank, por que uma com o PageRank 5/10 foi lista como última?

    []´s

  5. Pingback: Evitando conteúdo duplicado em seu site ou blog · No Topo das Buscas

  6. Me diga uma coisa Leandro, se eu usar none na tag robots todas as outras passam a ser consideradas? Exemplo, se adicionar NONE, automaticamente ele considera NOINDEX, NOFOLLOW, NOARCHIVE, NOSNIPPET e NOODP?

    Pelo que entendi ele deveria fazer isso certo?

    Abraços e continue com seu ótimo trabalho :)

  7. Micox, a resposta para sua perguta tem haver com o sitemap.xml que é posto na raiz do site. Dê uma pesquisada sobre isso que você vai entender.

    flw galera.