Parlamento banido do Google?

O site do parlamento português (www.parlamento.pt) não está neste momento indexado no Google. E dos seus subdomínios, apenas o canal parlamento tem algumas páginas indexadas, como podem confirmar. Terá o site do parlamento sido banido pelo Google?

O fenómeno é para mim inexplicável, até porque o site aparece listado no Yahoo e no Live. O domínio tem 13 anos de idade, dezenas de milhares de links, alguns dos quais de sites e instituições respeitadíssimos e, apesar do código ser muito pouco acessível a bots (notem a ironia do botão da acessibilidade.net), os motores de busca acabam por mais tarde ou mais cedo indexar este tipo de sites, ainda que a informação capturada seja parcial.

parlamento

O maior pecadilho que encontro no código do site, capaz de fazer soar os filtros de spam e causar a exclusão, é o abuso do texto escondido em javascript e css: 90% dos conteúdos da página de entrada estão em divs com o atributo visibility: hidden . Todavia, este texto surge numa janela em scroll (a azul na captura acima) ou em efeito OnMouseOver (nos links da esquerda), logo o seu uso é perfeitamente legítimo do ponto de vista das regras do Google.
Salvaguardando alguma eventual acção cometida no passado que justifique a exclusão do índice, a exclusão é uma medida cega e prepotente por parte do motor de busca.

O site do parlamento não está de forma alguma isento de responsabilidades; a página de entrada é um pesadelo para motores de busca e muito pouco amiga dos utilizadores. Textos em scroll, links em javascript, informação de leitura difícil, sem falar nos obstáculos colocados à indexação pelos motores de busca. Nem sequer a ignorância justifica o uso do símbolo da acessibilidade na web.

Sugiro ao webmaster do site do parlamento que entre em contacto com o Google e, se necessário, submeta um pedido de reinclusão. A prazo, gostaria de ver o site e a sua informação realmente acessível aos visitantes do site e a quem procura informação. Nos EUA já se discute legislação para obrigar as instituições federais a facilitarem o acesso dos seus sites aos motores de busca de acordo com as boas práticas de optimização.

Obrigado ao Rui pelo alerta.

Act.: nos comentários o Pedro Dias faz notar que é o site do parlamento quem barra a visita do Googlebot, ou seja esta ausência é totalmente alheia ao motor de busca. Ler mais em: Parlamento.pt barra robot do Google.

Se gostou desta entrada subscreva o Marketing de Busca e SEO por RSS ou directamente para o seu email. Privacidade absoluta.

Partilhar

Comentários

14 Respostas para “Parlamento banido do Google?”

  1. Gustavo Pimenta a February 21st, 2008 8:07

    O símbolo da acessibilidade que referes, seja qualquer for o site português que o use, é absolutamente irrelevante:

    http://tinyurl.com/2utz84

  2. Luís Miguel Silva a February 21st, 2008 9:39

    Será um novo sistema anti-corrupção da Google? ;o)

    Hugz,
    Luís

  3. domelhor.net a February 21st, 2008 10:02

    Parlamento.pt banido do Google?…

    O site da assembleia da republica portuguesa no est indexado no Google, embora o seja no live e yahoo. Ter o site do parlamento sido banido pelo Google?…

  4. Adufe 4.0 | A Assembleia da República não existe para o Google a February 21st, 2008 10:56

    [...] O António Dias pegou no caso e investigou-o na meida da do possível. Está tudo aqui em “Parlamento banido do Google?“. Para todos os efeitos podemos dizer que o Google baniu o sítio do nosso parlamento, resta [...]

  5. dissidentex a February 21st, 2008 12:17

    Meu caro amigo: este post carece de fundamentação prática e filosófica.
    Ou seja.
    Interroguemos-nos pois, se:
    será mau que o Google tenha banido o Parlamento da listas?

    Não será isso uma boa notícia?

    Até o Google necessita de erradicar lixo tornando suplementares ou irrelevantes as páginas que são irrelevantes.
    Até o Google necessita de ir à casa de banho.

    Por favor. Sê cavalheiro e aceita o destino reservado ao parlamento português. Ou seja, ser irrelevante na vida real e ser irrelevante nos motores de busca.

    É apenas a confluência dos dois estados que se manifesta aqui. Por uma vez a vida digital está a par da vida real e vice versa.

    Não perturbemos a harmonia do universo com estas notícias…e estes questionamentos interiores filosóficos…

    Deixa-os lá estar desindexados…como um nenúfar que fumou um charr*…e está pacificamente a curtir no mundo infinito e mais além…

  6. JPG a February 21st, 2008 15:04

    Verifiquei a indexação do site do parlamento com, por exemplo, o SESS da webconfs.com; não há qualquer problema aparente com o “varrimento” daquele domínio por “spiders”. Por conseguinte, parece-me que não foi a Google que “baniu” o parlamento português, terá sido este a banir a Google, muito provavelmente por instrução específica em .htacess e/ou robots.txt.
    Porquê?
    Mistério.

    P.S.: a ausência de meta keywords & description não é critério de exclusão suficiente para os “bots” da Google.

  7. Paulo a February 21st, 2008 16:25

    Também desconfiei que fosse uma atitude activa do Parlamento e não uma medida da G.
    Pelo robots.txt não é, mas pode haver barramento na configuração do webserver (um IIS, se bem me recordo).

  8. António Dias a February 22nd, 2008 5:13

    Ontem (na quarta) visitei o site como googlebot e não encontrei nada de especial. Se há barramento a nível do servidor envolve os IPs do Google, e isso é uma coisa demasiado sofisticada para quem apenas quer bloquear o googlebot. Quem faz ip-cloaking, normalmente fá-lo com as piores das intenções ou seja o site do parlamento ou o webmaster estaria a colocar links/fazer keyword stuffing no site, o que para mim é inacreditável.

    O yahoo e o live têm-no indexado, assim como aos subdomínios e se o problema fosse a página inicial outras páginas e subdomínios estariam indexados dado que o site tem sumo suficiente e deve haver links directos para outras páginas.

  9. Pedro Dias a February 22nd, 2008 10:17

    Querendo evitar idealismos e buzz gerado desnecessariamente… o site do Parlamento Português pode não estar indexado/a ser indexado correctamente por muitas razões. Porque havia o Google de excluír um site da importância do Parlamento de forma tão dramática como é relatado? Vamos lá… nós temos pessoas Portuguesas aqui também, e ainda sabemos como lidar com as coisas. E o António andou lá perto quado diz “…apesar do código ser muito pouco acessível a bots…” e “…a página de entrada é um pesadelo para motores de busca…”

    Ora, o site aparece no Yahoo e no Live (Microsoft anyone?), mas não aparece no Google… O Paulo deu a resposta certa “…mas pode haver barramento na configuração do webserver (um IIS, se bem me recordo).”

    Pronto, caso encerrado :)

  10. António Dias a February 22nd, 2008 10:47

    Thanks. Estou estupefacto.
    É para mim incompreensível porque haveria o parlamento de recusar o acesso à suas páginas aos cidadãos que procuram informação com o Google.

  11. Parlamento.pt barra o Google - Marketing de Busca a February 22nd, 2008 11:31

    [...] Na entrada anterior levantei a hipótese de o site do parlamento ser sido banido pelo Google. Na realidade, é o [...]

  12. Paulo a February 22nd, 2008 12:02

    António, eu compreendo a tua estupefacção — mas a mim não me surpreende. E até descortino duas ou três razões para assim ser. Uma delas, nabice. Outra, acidente (a tese do Pedro Dias, julgo). E há uma terceira ;)

  13. João Silas a February 22nd, 2008 18:52

    Deve ter sido por causa de spam xD

  14. bugflux.org » Blog Archive » ainda nesta história… a January 9th, 2009 14:56

    [...] 75%, a percentage em 2007 era de 50/50. importante assinalar também que, até há bem pouco tempo, nem o google indexava o site da assembleia da república, cuja estruturação se revela uma enorme dor de cabeça para [...]

Deixe uma Resposta






Fechar
E-mail It