Den gesamten Inhalt eines Forenthreads mit wget (oder curl) abrufen?

Den gesamten Inhalt eines Forenthreads mit wget (oder curl) abrufen?

Die URL des Forumsthreads, auf den ich zugreifen möchte, hat die Form

http://domain.com/showthread.php?threadid=3333333&userid=0&perpage=40&pagenumber=1

ich habe es versucht

wget --user-agent=Mozilla/5.0 -k -m -E -p -np -Rhttp://domain/showthread.php?noseen=0&threadid=3333333&pagenumber=1

und ich hatte kein Glück.

Antwort1

Warum nicht einfach in einer For-Schleife:

for pageno in {1..1000000}; do
    wget ... http://domain/showthread.php?noseen=0&threadid=3333333&pagenumber=$pageno || break
done

oder vielleicht ist eine While-Schleife besser, auch wenn sie etwas länger zu schreiben ist:

i=1
while true; do
    wget ... http://domain/showthread.php?noseen=0&threadid=3333333&pagenumber=$pageno
    if test $? -ne 0; then
        break
    fi
    i=$((i+1))
done

Antwort2

Es könnte sich lohnen, zu prüfen, ob das Forum RSS-Feeds von Abschnitten/Threads unterstützt. Das würde Ihnen Mühe ersparen.

verwandte Informationen