Saiu no Official Google Webmaster Central Blog um artigo intitulado como Using the robots meta tag falando a respeito da utilização da meta tag robots e como o Googlebot a interpreta. Vale a leitura.
Para aqueles que não dominam o inglês, vou simplificar o artigo linkado acima em alguns exemplos. Uma meta tag do tipo robot é criado da seguinte maneira:
<meta name="robots" content="Veja Valores abaixo" />
- NOINDEX – previne a página de ser indexada pelo Googlebot*;
- NOFOLLOW – previne o Googlebot de indexar qualquer link contigo na página;
- NOARCHIVE – previne que uma cópia da página seja disponibilizada no resultado da busca;
- NOSNIPPET – previne a descrição da página no resultado da busca bem como o cache dela;
- NOODP – bloqueia a descrição da página utilizada no resultado da busca no Open Directory Project;
- NONE – o mesmo que “NOINDEX, NOFOLLOW”.
Ae leandro,
Aproveitando o assunto, deixa eu te perguntar uma coisa que já pesquisei pesquisei, perguntei, consultei e não achei a resposta.
Você sabe comé que coloca-se links de categorias abaixo de nosso link no google? Assim como os caras do tableless.com.br fazem: http://www.google.com.br/search?q=tableless
Veja que abaixo do link deles tem “artigos e estudos”, “bonito de se ver”, etc…
E ae, sabe?
Cara, não sei ao certo. Acredito que é pelo fato deles utilizarem o serviço AdWord, e provavelmente há uma integração.
Será?
Micox,
A resposta simples seria PageRank alto incluindo as páginas internas.
E ela funciona quando você procura pelo domínio ou um termo muito forte da página como nome de produto.
Grande abraço,
Olá Paulo,
Interessante observação.
Agora, quanto ao PageRank alto seria o valor de cada página ou a soma deles? Fiz uma breve pesquisa aqui e o PageRank de cada página listada são os seguintes:
* http://www.tableless.com.br/ (6/10)
* http://www.tableless.com.br/aprenda/ (4/10)
* http://www.tableless.com.br/categorias/bonito-de-se-ver/ (2/10)
* http://www.tableless.com.br/categorias/desenvolvimento/video-tutorial/ (1/10)
* http://tableless.com.br/aprenda/ (5/10)
Fato interessante, o google considera http://www.tableless.com.br/aprenda/ como uma URL e http://tableless.com.br/aprenda/ como outra. Por que não considerar apenas uma?
Outro fato, se a ordenação das páginas exibidas forem o PageRank, por que uma com o PageRank 5/10 foi lista como última?
[]´s
Pingback: Evitando conteúdo duplicado em seu site ou blog · No Topo das Buscas
Me diga uma coisa Leandro, se eu usar none na tag robots todas as outras passam a ser consideradas? Exemplo, se adicionar NONE, automaticamente ele considera NOINDEX, NOFOLLOW, NOARCHIVE, NOSNIPPET e NOODP?
Pelo que entendi ele deveria fazer isso certo?
Abraços e continue com seu ótimo trabalho
Gabriel, segundo informações do próprio Google, nesta página: http://googlewebmastercentral.blogspot.com/2007/03/using-robots-meta-tag.html
utilizando o valor NONE é o mesmo que “NOINDEX, NOFOLLOW” como relatei no artigo.
Um abraço.
Micox, a resposta para sua perguta tem haver com o sitemap.xml que é posto na raiz do site. Dê uma pesquisada sobre isso que você vai entender.
flw galera.