Mejor solución

Mejor solución

Quiero descargar un foro al que solo tengo acceso mediante mi nombre de usuario y mi contraseña.

Intenté lo siguiente:

C:\wget.exe wget -k -m -E -p -np -R viewtopic.php*p=*,memberlist.php*,faq.php*,posting.php*,search.php*,ucp.php*,viewonline.php*,*sid*,*view=print*,*start=0* -o log.txt http://www.myforum1234.com/forum/categories/discussions

Entonces este es el comando que ingreso en mi cmd. Porque cuando hago clic en wget.exe aparece una ventana negra, pero desaparece muy rápidamente. Pero creo que esta también es la forma correcta (yo uso Windows XP).

Mi problema es que los resultados muestran que wget no pudo descargar el foro porque no pudo iniciar sesión. Entonces se muestra (descarga) la página de inicio de sesión, pero nada más. Estaba conectado cuando ejercí el comando.

No soy un profesional de wget, así que no estoy seguro de si mi comando es correcto. Copié esto de otra publicación. Un simple C:\wget.exe wget http://www.theforumurl.comno funcionó.

EDITAR:

Ahora también lo intenté

C:\wget.exe wget -k -m -E -p -np -R *start=0* -o log.txt http://www.myforum.com/forum/categories/discussions

Pero el mismo problema aquí.

2da EDICIÓNsobre el enlace en el primer comentario:

ahora lo intenté

C:\wget.exe wget -k -m -E -p -np -R *start=0* -o log.txt http://www.myforum.com/forum/categories/discussions --post-data="username&password=1234"

¡Pero de nuevo, el mismo problema!

Cuando paso el cursor sobre el botón de inicio de sesión, puedo ver la siguiente URL:

http://www.myforum.com/user/popupLogin

¿Tengo que usar este?

3ra EDICIÓN:

También intenté agregar el nombre de usuario: contraseña @ antes de www., así:

C:\wget.exe wget -k -m -E -p -np -R  *start=0* -o log.txt http://user:[email protected]/forum/categories/

El resultado es el mismo, puedo ver que el inicio de sesión no funcionó.

4ta EDICIÓN:

También lo intenté segúneste hilo:

C:\wget.exe wget --save-cookies cookies.txt --post-data 'user=usern&password=passw' http://www.myforum.com/user/popupLogin

C:\wget.exe wget --load-cookies cookies.txt -p http://www.myforum.com/forum/categories/

¡¡Pero de nuevo, el mismo problema!!

5ta EDICIÓN:

Creo que ahora aislé el código fuente del botón de inicio de sesión:

<div class="forumSignup">
          <a href="http://www.myforum.com/user/popupLogin" class="Button SignInPopup">Login</a> </div>

6ta EDICIÓN:

También lo probé con HTTrack, pero el problema es el mismo: el inicio de sesión no funciona. Otro problema parece ser que el foro en sí usa la URL www.mywebsite.com/forum, pero se requiere iniciar sesión para www.mywebsite.com. Entonces, cuando uso, por ejemplo, algo como nombre de usuario:[correo electrónico protegido]Se captura mi sitio web, pero no el foro. Cuando uso nombre de usuario:[correo electrónico protegido]/forum el inicio de sesión no funciona y no se captura nada.

Respuesta1

En primer lugar, lo harías C:\wget.exe -k -m …, no repites wgetel nombre.

Dado que iniciar sesión en el foro parece complicado (puede volverse complejo incluso para sitios simples), la mejor solución probablemente sea iniciar sesión con su navegador y luego darle las cookies* a wget (ya sea colocarlas en un archivo y usarlas --load-cookieso pasarlas directamente con --header "Cookie: name=value").

*La forma de extraerlos varía un poco dependiendo de tu navegador.

Respuesta2

Wget se interpreta <pass>@serveraddresscomo puerto.

Para especificar un nombre de usuario y contraseña, utilice los modificadores --usery :--password

wget --user username --password passw http://...

Respuesta3

Es difícil reflejar un sitio iniciando sesión usando wget. Necesita conocimientos expertos para utilizarlo wget. Actualmente, pasas el nombre de usuario y la contraseña, las cookies y los interruptores necesarios.
Cosas adicionales que hacer.
1. Evite la duplicación hasta que todo esté bien. Como la página de descarga recursiva obliga al servidor web a agregar su IP a la lista negra. (intente guardar una sola página)
2. Falso wget como navegador, ya que la mayoría de los foros web odian los administradores de descargas. veresteresponder para más información.

Mejor solución

La mejor y más sencilla forma de reflejar este tipo de sitio es utilizar **libro de recortes**. Es un complemento de Firefox. Todo lo que necesita hacer es iniciar Firefox, iniciar sesión en el sitio, hacer clic derecho -> guardar página como, filtrar por dominio. veresterespuesta para reflejar eficientemente un sitio.

Respuesta4

Si tiene acceso a los datos de las cookies en un navegador (Firefox tiene su propio navegador de cookies en opciones->privacidad, pero hay complementos para facilitar esta tarea), inicie sesión manualmente en el foro, busque todas las cookies para ese dominio y guárdelos en el archivo cookies.txt, probablemente funcionaría con su comando anterior:

C:\wget.exe wget --load-cookies cookies.txt -p http://www.myforum.com/forum/categories/

Algunas páginas de inicio de sesión son demasiado complejas para intentar realizar la tarea en una sola línea de comando.

Recuerde incluir TODAS las cookies de todo el dominio (busque "myforum.com", no solo "www.myforum.com")

información relacionada