O que é o Google Cache e sua importância para SEO

27 dez, 2021 | SEO | 0 Comentários

Os rastreadores da web do Google estão constantemente pesquisando na internet por páginas da web novas e atualizadas.

Você pode ter usado o Google Cache para visualizar versões antigas de sites que estão fora do ar ou que não carregam corretamente. Mas você sabia que também pode usá-lo para resolver problemas em seu site? Pode até ajudar em seus esforços de SEO .

Este artigo apresenta o Google Cache e como verificá-lo. Também veremos como o Google Cache é útil – e quando você não deve confiar muito nele.

O que é Google Cache?

Uma página em cache do Google é um backup em HTML bruto do conteúdo de uma página obtida durante um dos rastreamentos do Google. O Google Cache como um todo compreende essas páginas de backup.

Se você olhar a versão em cache do seu site , provavelmente será muito parecida com a de quando foi rastreado. Mas há alguns motivos pelos quais às vezes está diferente do que você espera.

Duas razões principais são:

  • A página da web é renderizada pelo seu navegador, não pelo Google. Isso pode causar discrepâncias com a versão atual do site.
  • O JavaScript não é salvo no cache, portanto, partes do seu site podem estar faltando.

No topo de uma página em cache, você verá um banner mostrando três coisas:

  1. O URL da página em cache – geralmente é o URL que você pretendia visitar. Em alguns casos, como um URL redirecionado, será diferente.
  2. A data em que esta versão da página foi armazenada em cache – você pode ver se a página em cache que está vendo foi criada ontem ou na semana passada. Esta não é necessariamente a última vez que sua página da web foi rastreada; vamos chegar lá em breve.
  3. Versões – você pode selecionar para visualizar a versão completa, a versão somente texto ou o código – fonte de sua página . A versão completa mostra a página conforme renderizada pelo seu navegador. A versão somente texto tem CSS desativado e nenhuma imagem exibida, mas você ainda verá hiperlinks. Ao clicar em Exibir código-fonte mostra o código-fonte da página:

Por que o Google Cache é importante

O uso principal do Google Cache é para pessoas que navegam na Internet. Isso permite que eles vejam páginas da web que estão fora do ar ou com problemas para carregar .

Como proprietário de um site, existem outros motivos pelos quais o Google Cache é crucial. Você espera que seu site nunca caia ou tenha falhas, mas acontece. Ter um cache torna seu conteúdo disponível para os usuários, mesmo se algo não estiver funcionando direito.

Você também pode usar a versão em cache do seu site para aprender como ele é indexado e diagnosticar problemas.

Como visualizar o Google Cache

Como você vai chegar a uma página do Google em cache a partir dos resultados do mecanismo de pesquisa do Google, vai depender do tipo de dispositivo que você está usando. Em um navegador de desktop, você tem duas opções:

  1. Você pode seguir um link para a versão em cache de uma página nos resultados de pesquisa do Google.
  2. Você pode ir diretamente para a página.

Em navegadores móveis, você só tem a opção de usar o URL direto.

Visualizando uma página em cache dos resultados de pesquisa do Google

Mesmo que você tenha experiência em visualizar sites em cache na página de resultados de pesquisa, talvez queira ler isto porque o Google mudou a forma de encontrar um link em cache no início de 2021.

Para começar, pesquise a página que deseja ver no Google. Ao lado do URL da página nos resultados da pesquisa, você deverá ver três pontos verticais. Clique neles e uma janela pop-up aparecerá com o nome “Sobre este resultado”:

Do Google
Recurso “Sobre este resultado” do Google.

Este recurso está atualmente em beta. Seu objetivo é permitir que você aprenda mais sobre um site (por exemplo, se ele é seguro) antes de clicar.

No canto inferior direito da janela pop-up, há um botão rotulado Em cache. Clique nele para ver a página em cache.

Em alguns casos, você pode não ver um botão Em cache . Isso pode significar que a página não foi armazenada em cache;

Mas se você estiver no celular, não verá o botão de nenhuma página. Nesse caso, continue lendo para aprender o outro método de exibição de uma página em cache.

Modificando a URL para visualizar a página em cache

Para este método, você deve saber o URL da página que deseja ver. Basta entrar cache:website.xyzna barra de pesquisa.

Por exemplo, cache:dabliope.como levará direto para a página inicial em cache.

Outras ferramentas para visualizar o Google Cache

Você não precisa de nenhuma ferramenta especial para visualizar as páginas em cache; O Google torna extremamente fácil nativamente. Mas existem algumas ferramentas com recursos que você pode gostar.

A extensão Web Cache Viewer para Chrome permite que você clique com o botão direito em qualquer link para ver a versão do Google Cache e a versão do arquivo da web do Wayback Machine da página.

E o Google Cache Checker do Small SEO Tools permite que você visualize os URLs e datas em cache para até cinco páginas de uma vez:

Uma captura de tela dos resultados da ferramenta Google Cache Checker mostrando várias páginas Kinsta.
Verificador de cache do Google.

 

Visualização de versões anteriores de uma página com o Google Cache

Sua página diz que foi armazenado em cache ontem, mas você deseja ver a versão da semana passada. É possível com o Google Cache?

Infelizmente não.

O Google só pode mostrar uma única versão de uma página em cache. Para ver as versões anteriores do site, você pode usar uma ferramenta como o Wayback Machine , um arquivo de versões anteriores de páginas da web.

Razões para usar o Google Cache como proprietário de um site

A verdade é que existem outras ferramentas disponíveis para realizar tudo o que está abaixo – em muitos casos, ferramentas mais sofisticadas .

Mas o Google Cache é difícil de vencer por ser rápido e fácil de verificar. Isso o torna uma forma valiosa de monitorar certos aspectos de suas páginas da web.

Aqui estão cinco maneiras de usar o Google Cache como proprietário de site.

1. Verifique se há conteúdo duplicado

Às vezes, você clica em um link armazenado em cache e chega a uma página diferente da esperada.

Um dos motivos pelos quais isso pode acontecer é o conteúdo duplicado . Quando o Google vê duas páginas muito semelhantes, pode decidir não mantê-las separadas no índice. Isso resulta em apenas um sendo mantido no cache.

O armazenamento em cache de várias páginas do Google no mesmo link pode alertá-lo de que há conteúdo duplicado em seu site. O conteúdo duplicado não apenas cria uma situação de cache confusa – é ruim para o SEO .

Aproveite a oportunidade para examinar as duas páginas e encontrar uma maneira de diferenciá-las.

2. Verifique se o Google respeita suas tags canônicas

Talvez o conteúdo duplicado em seu site seja intencional, mas você adicionou rel=canonicaltags para informar ao Google qual versão rastrear.

Verifique a versão do Google Cache de uma das páginas que você não deseja rastrear. Você deve ser levado a um cache da página canônica.

3. Certifique-se de que seus esforços de marketing foram rastreados

Você acelerou seus esforços de SEO ou produção de conteúdo e quer ter certeza de que o Google está indexando as mudanças.

Uma rápida olhada na versão em cache de uma página pode dizer que ela foi rastreada.

Observe que, se suas alterações não aparecerem na página em cache, elas ainda podem ter sido indexadas. Se você estiver preocupado, pode acessar o Inspetor de URL do Google Search Console para confirmar. Mas se você vir suas atualizações no cache, saberá que elas foram indexadas e começarão a impactar suas classificações de resultados de pesquisa.

4. Fique de olho nas mudanças nos sites concorrentes

Você cuida da sua própria vida, aproveitando sua posição no topo dos resultados de pesquisa para uma palavra-chave crítica quando um concorrente toma seu lugar do nada. O que eles fizeram para chegar lá? Você pode usar o Google Cache para descobrir. Compare suas páginas em cache com as versões atuais – você poderá ver quais alterações recentes o concorrente fez.

5. Recupere uma versão recente do seu site

Você deve sempre ter um backup do seu site , caso algo aconteça com ele. Dito isso, às vezes o pior pode acontecer, mesmo com a pessoa mais preparada.

Embora a versão do Google Cache de seu site não substitua um backup completo, às vezes permite que você veja a aparência de suas páginas antes que ocorra um desastre. Você pode usá-lo para recuperar conteúdo antigo ou código que foi perdido.

Limitações do Google Cache

O cache do Google pode fornecer informações úteis e pode valer a pena investigar se algo parecer estranho. Mas o Google Cache tem algumas limitações conhecidas.

O Google Cache não informa quando sua página foi rastreada pela última vez

Vamos começar com um dos maiores equívocos.

Muitas pessoas acreditam que o cache é atualizado sempre que o Googlebot rastreia uma página. Muitos outros artigos sobre este assunto dirão que você deve usar o cache para ver com que frequência sua página é rastreada.

Não é verdade.

Sabemos disso porque John Mueller, do Google, disse isso em um tópico de ajuda , dizendo:

“Em geral, nem sempre atualizamos a página em cache sempre que rastreamos uma página. Especialmente quando a página não muda significativamente, podemos optar por apenas manter [sic] a data anterior nela. ”

Aqui está uma dica profissional: se você está procurando informações sobre com que frequência, por que e com quais bots o Google rastreia seu site, esqueça o cache. Esses dados estão no Google Search Console. Você pode encontrar o relatório de rastreamento em Configurações na barra lateral.

No entanto, você só pode ver essas informações no nível do domínio. O Search Console não informa com que frequência cada página é rastreada.

A página pode não ser reproduzida corretamente

Felizmente, algum progresso foi feito nessa frente. O serviço de renderização da web do Google, que renderiza páginas ao vivo na web, costumava ser baseado em uma versão desatualizada do Chrome. Consequentemente, os navegadores atualizados às vezes renderizam uma página em cache de maneira diferente do que o Google renderiza a página atual.

Desde 2019, o Google Web Rendering Service usa a versão mais recente do Chrome.

No entanto, se a sua versão do Chrome for antiga ou se você estiver usando um navegador diferente , a página em cache pode ser renderizada de forma inadequada.

Outro problema de renderização tem a ver com recursos ausentes . O código que o Google faz backup pode se referir a um recurso como CSS ou JavaScript. Se esses recursos não existirem mais ou tiverem sido alterados, a página não será renderizada corretamente.

A página errada é exibida

Já vimos como conteúdo duplicado ou tags canônicas incorretas podem fazer com que o Google Cache exiba a página errada. Como você pode imaginar, isso limita a utilidade de olhar o cache para páginas da web específicas.

Algumas páginas não são armazenadas em cache

Isso pode ser uma surpresa, mas acontece que muitas páginas não são armazenadas em cache.

Um equívoco generalizado é que um site sem cache significa que o Google não o considerou essencial, mas isso não é necessariamente verdade. Veremos alguns motivos pelos quais uma página pode não ser armazenada em cache a seguir.

Por que não consigo encontrar minha página da Web em cache?

Nem todas as páginas rastreadas são armazenadas em cache. Se sua página não tiver uma versão em cache, não entre em pânico! Isso não significa que sua página não foi indexada.

Um erro 404 indicando que uma página não tem versão em cache.
Um erro 404 indica que uma página não tem versão em cache.

Se você está preocupado porque realmente não foi indexado, você pode usar o Inspetor de URL do Google Search Console para verificar.

Para provar que as páginas indexadas nem sempre são armazenadas em cache, voltamos ao John Mueller do Google. No Twitter , ele respondeu a um usuário perguntando sobre uma página sem cache:

“Não armazenamos em cache todas as páginas que indexamos, então isso pode acontecer. Às vezes demora um pouco, às vezes simplesmente não armazenamos em cache. ”

E quando o usuário perguntou se os sites sem cache sempre eram de baixa qualidade, ele disse:

“Isso pode ser todos os tipos de páginas para peculiaridades técnicas estranhas. O cache é meio separado, então não é indicativo do que indexamos e classificamos. ”

Em outras palavras, as páginas em cache não são um fator de classificação . Você pode chegar ao topo dos resultados da pesquisa, mesmo que suas páginas da web não tenham versões em cache.

Mas uma página sem cache ainda pode valer a pena dar uma olhada. Existem algumas possibilidades diferentes que você pode explorar.

Sua página é baseada em JavaScript

O Google tem mais facilidade em indexar algumas páginas com JavaScript do que outras. Mas muitas páginas JavaScript acabam sem cache ou mesmo sem indexação.

Isso ocorre porque a maior parte do HTML não é carregada até que o JavaScript seja executado. Se não houver nada para indexar, o Google não criará uma página em cache.

O cache é impedido por uma metatag

Uma noindexmetatag no código HTML da sua página significa que a página não pode ser indexada pelo Google, mas noarchiveimpede que seja armazenada em cache. Qualquer um deles resultará em uma página sem cache.

Talvez seja exatamente o que você deseja. Mas se você não percebeu que tinha uma tag noindexou noarchivena página, removê-la pode resolver seu problema de cache ausente.

A página é uma duplicata (ou o Google pensa que é)

Se o Google decidiu que duas de suas páginas são duplicadas, encontre maneiras de torná-las exclusivas. Considere as diferentes intenções de pesquisa para cada página.

Como corrigir problemas com as páginas em cache do seu site

Sua página não precisa ser armazenada em cache, mas se você quiser que isso aconteça, existem algumas coisas que você pode fazer.

Envie sua página para o Google

Se você está preocupado porque o Google não indexou sua página, você pode verificar o Google Search Console.

Insira o URL da página na barra de pesquisa de inspeção de URL na parte superior do Search Console. Se você obtiver o resultado “URL está no Google”, a página foi indexada. Se a página mudou recentemente e você acha que o Google não indexou a nova versão, clique em Solicitar indexação para pedir ao Google para reindexá-la.

Você também pode obter o resultado “A página não está no Google”. Se fizer isso, role para baixo e você poderá ver alguns detalhes sobre a página. Por exemplo, você pode verificar se o rastreamento é permitido nessa página e se o canônico escolhido pelo usuário corresponde ao canônico escolhido pelo Google. Para solicitar indexação , clique em Solicitar indexação :

Ferramenta de inspeção de URL do Google Search Console com uma seta apontando para a opção "Solicitar indexação".
Solicitação de indexação de URL do Google Search Console.

Verifique se há problemas comuns do site

Já abordamos vários motivos pelos quais suas páginas podem não ser armazenadas em cache, como JavaScript extenso e conteúdo duplicado.

Além disso, a melhor coisa que você pode fazer para incentivar a indexação frequente é criar um site de alta qualidade. Certifique-se de que otimizou seu site para celular e que a velocidade de seu site é alta .

Se o tempo de carregamento da sua página for muito lento, isso pode até mesmo desacelerar os bots do Google, levando a atrasos na indexação.

Como remover páginas do Google Cache

Achamos que o Google Cache é bastante útil, mas você pode não querer uma versão antiga de sua página da web armazenada nos servidores do Google por vários motivos. Por exemplo, talvez você não queira que páginas de produtos descontinuados estejam disponíveis.

Uma maneira de evitar o armazenamento em cache de suas páginas é com as tags noindexnoarchivemencionadas acima. Essas tags são a solução permanente ideal se você deseja manter as páginas, mas nunca deseja que elas sejam armazenadas em cache.

Você também pode pedir diretamente ao Google para remover URLs do Google Cache. Para fazer isso, vá para o Google Search Console e clique em Remoções na barra lateral. Em seguida, clique em Novo pedido . Neste ponto, você tem duas opções: Remover URL temporariamente e Limpar URL em cache .

A remoção temporária significa que o URL não aparecerá nos resultados de pesquisa do Google por cerca de seis meses. O cache também desaparecerá. A página será reindexada e rearmazenada em cache quando estiver ativa novamente (se você não quiser que isso aconteça, será necessário adicionar uma metatag).

Limpar o URL em cache é exatamente o que parece ser. O cache será removido, mas a página será armazenada em cache novamente quando o site for rastreado.

Se você deseja que uma versão antiga de uma página atualizada desapareça, esta é uma excelente maneira de fazer isso. Você também pode reforçar o seu pedido ao Google para atualizar o cache da sua página, enviando a página para indexação depois de alterá-la.

Resumo

O Google Cache não é tudo que dizem que é. Você não pode usá-lo para verificar quando seu site foi rastreado pela última vez – tê-lo não melhora suas classificações no mecanismo de pesquisa. E às vezes, a versão armazenada do seu site é estranha, incompleta ou simplesmente errada.

Mas o Google Cache tem seus usos para proprietários de sites. É uma maneira rápida de verificar como seu site foi indexado e pode ajudá-lo a perceber e diagnosticar problemas. Você também pode usar o Google Search Console para melhorar suas classificações no mecanismo de pesquisa .

Artigo Original por

Se inscreva para não perder nosso conteúdo