O cache em navegadores modernos é uma droga, por que e como consertar?

O cache em navegadores modernos é uma droga, por que e como consertar?

Uma coisa que notei onde todos os navegadores modernos deixam a desejar é o cache. Lembro-me de anos atrás no Internet Explorer 5 - um navegador que era um horror para os padrões de hoje! - que eu poderia selecionar "Arquivo/Modo Offline" a qualquer momento e depois navegar no cache por tudo que visitei nos últimos dias. Ele até ativaria automaticamente o modo offline quando a conexão caísse. Além disso, parecia usar o cache de forma muito mais agressiva do que hoje em dia, mesmo ao navegar online. Tudo isso era uma necessidade com os modems da época e suas conexões lentas e pouco confiáveis. Hoje em dia, quando estou viajando com meu netbook, posso usar esse recurso com frequência, especialmente quando o WiFi está instável ou não está disponível.

O Firefox ainda tem a opção de "trabalhar offline" e funciona em algumas páginas, mas parece muito limitado. Além disso, não há uma maneira direta de ver quais sites do meu histórico estão armazenados em cache.

Existe uma maneira de tornar o cache mais "agressivo" ou abrangente e o modo offline útil novamente? Talvez extensões ou um determinado navegador?

Responder1

Um autor de HTML pode usar cabeçalho e metatags para instruir um navegador a não armazenar uma página em cache.

Esta é a tendência agora, dado que HTML e navegadores são mais ou menos considerados atualmente como formando um protocolo geral/ambiente de tempo de execução em nível de aplicativo, e não apenas um protocolo estático de recuperação de documentos.

É tecnicamente possível remover/alterar qualquer conteúdo indesejado de documentos HTML usando um servidor proxy. squidforneceria a estrutura para esse recurso - incluindo a execução de solicitações HTML por meio de um script que pode modificar coisas rapidamente - mas você teria que escrever seu próprio script que modifica tags, criando um comportamento indesejado. Além disso, mexer com Javascript nas páginas é confuso, demorado, diferente para cada site, e a recompensa geralmente não vale o esforço.

Não conheço uma solução pronta para uso que forneça isso.

Geralmente achei útil capturar páginas imprimindo-as em .PDF ou similar, em vez de depender do cache do navegador para lembrar o que estava fazendo.

Responder2

Versões anteriores squid(2.2 e anteriores) possuem um recurso "offline_mode".

Este modo desativa a validação de cache, ou seja, se o recurso já estiver no cache do squid, o squid não entrará em contato com o site original para verificar se o recurso armazenado em cache é válido/fresco ou não.

Combine offline_mode one um pega-tudo agressivo, refresh_patterncomo

refresh_pattern . 10080 9999% 43200 override-expire ignore-reload ignore-no-cache ignore-no-store ignore-must-revalidate ignore-private override-lastmod reload-into-ims store-stale

e você pode ficar off-line pormesese ainda poder revisitar sites estáticos que você visitou antes!

Para mais informações, leiahttp://www.squid-cache.org/Doc/config/offline_mode/ehttp://linuxdevcenter.com/pub/a/linux/2001/08/02/offline_squid.html. O Squid roda na maioria dos sistemas operacionais, então experimente.

Espero que isso responda à sua última pergunta.

Agora, para responder ao "porquê" do título da sua pergunta, a web agora não é o que era desde o IE5. A maioria dos sites irá quebrar no modo offline. A web tornou-se mais dependente de conteúdo dinâmico ao vivo, ou seja, muito conteúdo agora não é projetado para ser armazenado em cache por muito tempo. Leressa questãoEu perguntei na lista de discussão de usuários do Squid.

informação relacionada