
He estado intentando guardar esta página:
http://www.geopostcodes.com/Bolton?loc=Bolton
(y otros similares del mismo dominio) pero siempre aparece un error acerca de que NOCAPTCHA no funciona y el Javascript para la parte Mostrar siguiente... de la página no funciona.
Probé Scrapbook en Firefox 56 y obtuve ese error. SiteSucker = mismo error.
¡Bájenlos a todos! para Firefox hizo varias URL pero aún tenía el mismo error NOCAPTCHA para todas las páginas.
No he probado HTTrack porque estoy en OSX y aún no he instalado MacPorts.
Guardarlo de manera convencional a través de Guardar página como... Aún no lo he intentado, pero eso se debe a que estaba tratando de encontrar una manera de guardar varias URL del sitio.
Básicamente, quiero intentar guardar todas las páginas desde dentro.
http://www.geopostcodes.com/UK(y subpáginas)
para la posteridad
Estoy en una Mac Mini 2011 y uso Mac OS Sierra.
Le agradecería que alguien pudiera ayudarme a encontrar una solución viable para preservar páginas para la posteridad para su uso sin conexión.
Respuesta1
Esas páginas se generan mediante llamadas Javascript y ajax al servidor mientras las ve. Copiar el HTML o guardarlo desde un navegador simplemente no funcionará.
Lo mejor que puede hacer es copiar y pegar los datos que desee de la página en un archivo de texto u hoja de cálculo. O eso, o escriba un complemento de navegador que extraiga los datos por usted.