Wie navigiere ich mit WGET durch die PHP-basierte Paginierung?

Question

Diese Site hat ein besonders merkwürdiges Design. Nur ein Hinweis: PHP macht hier keinen Unterschied.

Es sieht so aus, als würden sie Seiten mit der folgenden Methode laden:

Wenn Sie auf den Link klicken, wird JS ausgeführt.
Dieses JS füllt ein verstecktes Formular mit der Seitenzahl aus.
Anschließend übermittelt das Skript das Formular, das wiederum eine POST-Anfrage an den Server sendet.
Der Server antwortet direkt mit der entsprechenden Seite.

Sie haben hier mehrere Möglichkeiten. Am einfachsten ist es, einfach eine wgetAnfrage --post-datain einer Schleife zu schreiben, um alle Seiten von 1 bis n abzurufen. Lesen Sie in der Dokumentation und im Netzwerkmonitor Ihres Browsers nach, um herauszufinden, was die eigentliche Anfrage ist. Der Netzwerkmonitor von Firefox gibt beispielsweise Folgendes als Anfragetext an:

Content-Type: application/x-www-form-urlencoded
Content-Length: 145

pagingQuery=select+*+from+tblbabynames+where+++religion%3D%27hindu%27+and+gender%3D%27M%27+limit+0%2C30&totalRows=3097&pageNum=2&searchResultNo=0

pageNum=2Sie können das wahrscheinlich in einer Schleife ersetzen .

Eine aufwändigere Methode wäre die Verwendung eines Browser-Automatisierungs-Toolkits wie Selenium, um buchstäblich durch zu navigieren undklickendie Links und aktiviert das JS genau wie ein Mensch es tun würde.

Answer 1