El almacenamiento en caché en los navegadores modernos apesta, ¿por qué y cómo solucionarlo?

El almacenamiento en caché en los navegadores modernos apesta, ¿por qué y cómo solucionarlo?

Una cosa que he notado en la que todos los navegadores modernos fallan es el almacenamiento en caché. Recuerdo hace años en Internet Explorer 5, ¡un navegador que era un horror para los estándares actuales! - que podía seleccionar "Archivo/Modo sin conexión" en cualquier momento y luego explorar todo lo que visité en los últimos días desde el caché. Incluso activaría automáticamente el modo fuera de línea cuando la conexión se interrumpiera. También parecía utilizar el caché de forma mucho más agresiva que hoy en día, incluso cuando se navega en línea. Todo esto era una necesidad con los módems de la época y sus conexiones lentas y poco confiables. Hoy en día, cuando viajo con mi netbook, puedo usar con frecuencia esta función, especialmente cuando el WiFi no funciona o no está disponible.

Firefox todavía tiene una opción para "trabajar sin conexión" y funciona en un puñado de páginas, pero parece muy limitada. Además, no existe una forma sencilla de ver qué sitios de mi historial están almacenados en caché.

¿Hay alguna manera de hacer que el almacenamiento en caché sea más "agresivo" o completo, y que el modo fuera de línea vuelva a ser útil? ¿Quizás extensiones o un determinado navegador?

Respuesta1

Un autor de HTML puede utilizar encabezados y metaetiquetas para indicarle a un navegador que no almacene en caché una página.

Esta es la tendencia actual, dado que hoy en día se considera más o menos que HTML y los navegadores forman un protocolo/entorno de ejecución a nivel de aplicación general, y no sólo un protocolo estático de recuperación de documentos.

Es técnicamente posible eliminar/cambiar cualquier material no deseado de los documentos HTML utilizando un servidor proxy. squidproporcionaría el marco para esta capacidad, incluida la ejecución de solicitudes HTML a través de un script que puede modificar cosas sobre la marcha, pero tendría que escribir su propio script que modifique las etiquetas creando un comportamiento que no desea. Además, jugar con Javascript en las páginas es complicado, requiere mucho tiempo, es diferente para cada sitio y la recompensa generalmente no vale la pena.

No conozco ninguna solución llave en mano que proporcione esto.

En general, me ha resultado útil capturar páginas imprimiéndolas en formato .PDF o similar en lugar de depender del caché del navegador para recordar lo que estaba haciendo.

Respuesta2

Las versiones anteriores squid(2.2 y anteriores) tienen una función "offline_mode".

Este modo desactiva la validación de caché, es decir, si el recurso ya está en el caché de squid, squid no se comunicará con el sitio web original para verificar si el recurso almacenado en caché es válido/actualizado o no.

Combine offline_mode ony un comodín agresivo refresh_patterncomo

refresh_pattern . 10080 9999% 43200 override-expire ignore-reload ignore-no-cache ignore-no-store ignore-must-revalidate ignore-private override-lastmod reload-into-ims store-stale

y puedes desconectarte pormeses¡Y aún podrás volver a visitar sitios web estáticos que visitaste antes!

Para más información, leahttp://www.squid-cache.org/Doc/config/offline_mode/yhttp://linuxdevcenter.com/pub/a/linux/2001/08/02/offline_squid.html. Squid se ejecuta en la mayoría de los sistemas operativos, así que pruébalo.

Espero que esto responda a tu última pregunta.

Ahora, para responder el "por qué" del título de su pregunta, la web ahora no es lo que era desde IE5. La mayoría de los sitios web fallarán en el modo fuera de línea. La web se ha vuelto más dependiente del contenido dinámico en vivo, es decir, ahora gran parte del contenido no está diseñado para almacenarse en caché por mucho tiempo. Leeresta preguntaPregunté en la lista de correo de usuarios de Squid.

información relacionada