pular para o conteúdo [1]

Artigos sobre Front-End e Programação web

Como Remover Conteúdo dos Resultados do Google

Como proprietário de um site, geralmente desejamos que o Google indexe o máximo de páginas possível. Entretanto, às vezes, precisamos remover paginas dos resultados de pesquisa do Google, assim como remover conteúdo desatualizado. É comum descobrimos que acidentalmente deixamos o Google indexar conteúdo confidencial ou outras informações que não deveriam aparecer nos resultados de busca.

Neste artigo apresento as melhores maneiras de remover uma ou várias URLs da pesquisa do Google.

Sumário

Há vários motivos pelos quais você pode querer excluir seu conteúdo do Google

  • Algumas informações vazaram para o mecanismo de pesquisa muito cedo, como detalhes sobre um novo serviço ou produtos que ainda não foram lançados;
  • A página já foi excluída, mas suas informações ainda estão disponíveis, por exemplo, informações publicadas por engano;
  • As informações do site são atualizadas, mas o mecanismo de pesquisa ainda exibe a versão antiga.

Voltar ao topo

Excluir a página do servidor

Se o URL que você deseja remover não tiver nenhum objetivo dentro do seu site, basta excluí-la do seu site. Pode-se excluir via plataforma ou pelo FTP.

Certifique-se que o URL dessa página retorne status HTTP 404. Recomendo a utilização de ferramentas online como https://httpstatus.io/.

Testando status 404 de uma página removida

Status 404 indica que a página foi removida com sucesso do servidor

Excluindo a página do servidor fará com que a URL retorne um erro 404 (não encontrado) ou 410 (desaparecido). O Googlebot (robô do Google) tentará rastrear a página mais algumas vezes, porém, com o status é 404 o Google entende que a página foi removida e a remove do índice.

Voltar ao topo

Aplicar redirecionamento 301

Às vezes, a página que você deseja remover pode ter tráfego constante ou links de entrada que fornecem valor para o SEO.

Nesse caso, pode ser melhor para a experiência do usuário e para o SEO usar um redirecionamento 301. Dessa forma redirecionamos os usuários e bots de mecanismo de pesquisa para uma página equivalente.

Ferramenta https://httpstatus.io/ confirmando status 301.

Testando o redirecionamento de uma página

Status 301 indica que a URL tem um redirecionamento

O código de um redirecionamento 301 informa ao Google que a URL mudou, após alguns dias a tendência é que o Google substitua a página antiga pela nova nova página (página que recebe o redirecionamento 301).

Você pode criar 301 redirecionamentos no WordPress com o plug-in Redirection gratuito.

Voltar ao topo

Ferramenta oficial de remoção de URL do Google

Você precisa ter permissão de proprietário do Search Console para usar esta ferramenta; outros usuários não poderão usá-la. Se você controla o conteúdo que deseja remover esta ferramenta é sua melhor alternativa.

Ferramenta url-removal foi descontinuada pelo Google. Use o novo relatório do Search Console de Remoção de Conteúdo.

Remover URL imediatamente

Ferramenta eficaz no curto prazo porque remove quase que imediatamente a página do resultado de busca, porém, a exclusão poderá ser temporária em alguns casos.

A página será definitivamente removida do índice de pesquisa por 90 dias. Posteriormente, existe a possibilidade da URL ser reintroduzida no índice, principalmente se a URL ainda estiver acessível e com links que ainda apontam para ela.

O Google normalmente processa a solicitação dentro de 24 a 48 horas.

Acesse a Ferramenta do Google Remover URL e escolha uma propriedade. Clique em “Remoções temporárias” (por padrão deve vir selecionada). Abaixo a uma imagem que ilustras os passos a serem seguidos.

Escolha Limpar o URL do cache e remover temporariamente da Pesquisa e clique em “Enviar pedido”.

Remover URL do Google temporariamente

Esta opção remove a página dos resultados de busca e cache

Após clicar no botão “Próxima” clique em “enviar solicitação”.

Limpar o URL do cache e remover temporariamente da Pesquisa:
Remove a página dos resultados da Pesquisa Google por aproximadamente 90 dias e limpa o conteúdo da página e do snippet armazenados no cache do Google

Observações:

  • Se você mudar de ideia, poderá cancelar uma solicitação de remoção no Google Search Console clicando em “Cancelar Solicitação” ao lado do URL;
  • Se sua solicitação foi negada, selecione “Saiba mais” para obter mais informações sobre por que o Google pode ter negado a solicitação.

Voltar ao topo

Removendo o cache do conteúdo do seu site que foi alterado

Às vezes, você não deseja remover completamente as páginas do Google, apenas o conteúdo antigo que você removeu, que ainda aparecem no cache do Google.

Esta opção mantém o URL na página do Google, mas remove o snippet atual e também a versão em cache até o próximo rastreamento ser realizado.

Depois de alterar o conteúdo da página, você pode esperar que o Google rastreie e reindexe novamente ou pode solicitar que o Google remova o conteúdo antigo até que a página seja rastreada novamente.

Acesse a ferramenta do Google Remover URL e escolha uma propriedade. Clique em “Nova Solicitação” e siga os passos da imagem abaixo.

Ferramenta remover conteúdo de cache do Google

Remover snippet atual do cache do Google

Clique no botão próximo (passo 3 imagem acima). Próxima tela clique em “Enviar solicitação”.

Limpar o URL somente do cache:
Limpa o conteúdo da página e do snippet armazenados no cache do Google, porém, a página não é removida dos resultados da Pesquisa do Google.

Voltar ao topo

Remover todo domínio do Google

Abra a ferramenta de remover URL do Google. Não preencha nada no campo “insira o URL”, marque a opção “Remover todos os URLs com o prefixo”. Conforme imagem abaixo:

Ocultar todo domínio dos resultados do Google

Ocultando TEMPORARIAMENTE todo domínio do Google

Observações:

  • Esta opção remove temporariamente todo domínio dos resultados de pesquisa do Google

Voltar ao topo

Quando não usar a ferramenta de remoção de URL

Um erro comum é tentar usar a Ferramenta de Remoção de URL para corrigir problemas de canonização. Se você tiver problemas de duplicação de URL, resolva-os usando um método mais adequado para o problema, como canonização.

Outro uso incorreto da ferramenta ocorre durante as mudanças no site (como nome de domínio, por exemplo). Algumas pessoas usam a ferramenta para remover a versão antiga dos URLs, entretanto, não é recomendado. Em vez disso, use o redirecionamento 301. Redirecione os URLs antigos para os novos.

para saber mais detalhes recomendo ler a documentação oficial do Google Ferramenta de remoção.

Voltar ao topo

Bloquear página através de um login e senha

A melhor maneira de garantir que o robô não indexe nenhuma página.

Exigir um login para acessar as informações. Esse método não apenas mantém o Google de fora, mas garante que apenas aqueles que você deseja visualizem o conteúdo.

O Google não pode indexar páginas que exigem login para acesso. Uma maneira infalível de garantir que o conteúdo não seja indexado por engano, por exemplo,

Você usaria esse método, por exemplo, para manter informações sobre o lançamento de um novo site ou produto.

Exemplo de um plugin gratuito para bloquear o site inteiro com uma senha. Isso impede que suas páginas sejam indexadas na pesquisa do Google.

Essa técnica não remove a página do Google, no caso de já estar indexada. Primeiro é preciso remover a página do Google.

Voltar ao topo

Bloquear o rastreamento de um site inteiro do Google

Podemos impedir que o site seja rastreado por robôs de mecanismo de pesquisa adicionando isso ao seu arquivo robots.txt:

User-agent: *
Disallow: /

Esse método pode ser útil quando não há nenhuma página indexada. Essa diretiva diz que nenhuma página deve ser rastreadas, logo não serão indexadas.

Voltar ao topo

Robots não exclui páginas dos resultados de busca

O arquivo robots permite que você controle para onde os robôs de busca vão no seu site. O nome técnico para isso é “Protocolo de exclusão de robôs” e permite especificar quais partes do seu site não devem ser vistas ou processadas, como no exemplo “Bloquear o rastreamento de um site inteiro do Google”.

No caso de uma página já indexada, não use o arquivo robots.txt para remover tal página. Não é uma maneira eficaz de remover uma página existente no índice do Google, já que o robots bloqueia o rastreamento, e não a indexação.

Lembre-se de que, se você não permitir o rastreamento da página (bloqueando via robots), o Google ainda mostrará a página no índice. Isso porque o Google não tem permissão para rastrear, mas ele já conhece a página.

Se você deseja remover a página, é necessário PERMITIR o rastreamento para a página (não o adicione “Disallow” ao arquivo robots.txt) e adicione a metatag ‘noindex’ na página para impedir que ela seja indexada.

Voltar ao topo

Mantenha a página acessível, mas invisível para o Google

Método para remover uma páginas do Google. Utilize sempre que desejar não indexar uma página ou remover uma página já indexada.

Adicione uma tag NOINDEX ao cabeçalho do HTML. A tag NOINDEX informa aos mecanismos de pesquisa que não devem mais indexar a página. Dentro de alguns dias, a página é normalmente removida automaticamente dos resultados da pesquisa.

Adicionando o seguinte ao código fonte de uma página, ele será removido do índice:

<meta name="robots" content="noindex">
Certifique-se de não bloquear a página com robots.txt, pois o Google não poderá “ver” a diretiva noindex.

Outra opção para especificar noindex é com o cabeçalho HTTP X-Robots. O comportamento é o mesmo da meta noindex. No entanto, o X-Robots não é especificado no HTML, mas na resposta do cabeçalho HTTP. Como resultado, não é visível no código, mas somente quando você inspeciona os cabeçalhos HTTP.

Um exemplo de utilização seria para conteúdo não HTML, como imagens ou PDFs.

Para saber mais acesse a documentação do Google: Como usar o cabeçalho HTTP X-Robots-Tag.

Voltar ao topo

Google continua exibindo página removida

Embora suas páginas sejam excluídas, elas ainda podem aparecer nos resultados da pesquisa. Se você não deseja esperar até que o Google rastreie a página e a remova, use a ferramenta Remover conteúdo desatualizado.

Isso basicamente ajuda o Google a rastrear, notificando-o de que uma página foi excluída e deve ser removida dos resultados da pesquisa.

Utilize a ferramenta quando:

  1. Você já removeu uma página e ela retorna status HTTP 404, porém, segue aparecendo nos resultados de busca;
  2. O Snippet (title + description) são apresentados diferentes do conteúdo da página atual.
Ferramenta de remoção de conteúdo desatualizado

Ferramenta do Google para remoção de conteúdo desatualizado

O Google analisará o URL e confirmará que o conteúdo não existe mais ou informará que o Google ainda pode acessar o conteúdo. Se o Google ainda conseguir acessar o conteúdo, será necessário voltar às etapas anteriores e remover a visibilidade do conteúdo pelos mecanismos de pesquisa (Como remover a página do servidor).

Voltar ao topo

Conclusão

Se você seguiu todas as regras para remover o conteúdo e, no entanto, ele ainda aparece, pode estar lidando com vários URLs que exibem conteúdo duplicado. Nesse caso a solução pode ser o uso da meta canonical.

Antes de remover a página você precisa determinar se a página oferece algo de valor. Por exemplo, uma página de login, pode não agregar valor ao SEO do site, mas sim para a experiência dos seus usuários.

Outro exemplo: uma página de tag em um site geralmente não é algo que desejamos incluir nos resultados de pesquisa. Mas uma página de tag dentro do site pode ser uma maneira eficaz de envolver os usuários dentro no site.

Ao avaliar o valor de uma página, não se concentre apenas no valor que a página pode oferecer para uma campanha de SEO, mas também no valor de contribuição para a experiência do usuário.

O Google não fornece suporte por telefone para esses tipos de problemas. No entanto, você pode se conectar com outras pessoas que podem ter problemas semelhantes com o seu no fórum para Webmasters.

Voltar ao topo

Categorias: SEO |

Comentários desativados.

Topo