¿Formato de cookies al usar wget?

¿Formato de cookies al usar wget?

¿Cuál es el formato Netscape de wget's cookies.txt? Necesito reflejar un sitio web que requiere iniciar sesión. Utilizo una extensión de Chrome que devuelve cookies en ese formato, las guardo en cookies.txt, las importo con wgetun comando pero no uso, simplemente descarga el contenido como si no hubiera iniciado sesión en absoluto.

Agradezco cualquier ayuda.

Respuesta1

El formato es el formato Netscape como se indica en la página de manual y este formato es:

El diseño del archivo cookies.txt de Netscape es tal que cada línea contiene un par nombre-valor. Un archivo cookies.txt de ejemplo puede tener una entrada similar a esta:

.netscape.com TRUE / FALSE 946684799 NETSCAPE_ID 100103

Cada línea representa una única pieza de información almacenada. Apestañase inserta entre cada uno de los campos.

De izquierda a derecha, esto es lo que representa cada campo:

dominio- El dominio que creó Y que puede leer la variable.

bandera- Un valor VERDADERO/FALSO que indica si todas las máquinas dentro de un dominio determinado pueden acceder a la variable. Este valor lo establece automáticamente el navegador, según el valor que establezca para el dominio.

camino- La ruta dentro del dominio para el que es válida la variable.

seguro- Un valor VERDADERO/FALSO que indica si se necesita una conexión segura con el dominio para acceder a la variable.

vencimiento- La hora UNIX en la que caducará la variable. El tiempo UNIX se define como el número de segundos desde el 1 de enero de 1970 a las 00:00:00 GMT.

nombre- El nombre de la variable.

valor - El valor de la variable.

(De "Preguntas frecuentes sobre cookies no oficiales", editado para mayor claridad)

Respuesta2

El formato de archivo de cookies de Netscape para cada línea de datos es el anterior, pero no podrá leerlo a HTTP::Cookies::Netscapemenos que tenga una línea de encabezado como esta, que requiere el formato de archivo completo:

# Netscape HTTP Cookie File

o esto:

# HTTP Cookie File

Respuesta3

Una forma de obtener cookies para wget es utilizar las opciones --keep-session-cookies de wget.

Por ejemplo :

wget --keep-session-cookies --save-cookies cookies.txt "http://MYSITE/?__login=USER&__password=PASS"

Depende ?__login etcdel sitio web que esté intentando reflejar, es posible que deba observar cómo funciona el formulario de autenticación.

Entonces puedes usar:

wget --mirror --load-cookies cookies.txt http://MYSITE/

información relacionada