Как осуществлять навигацию по страницам на основе PHP с помощью WGET?

Question

У этого сайта особенно странный дизайн. Но заметьте, PHP тут не играет никакой роли.

Похоже, они загружают страницы следующим методом:

При нажатии на ссылку выполняется некоторый JS-код.
Этот JS заполняет скрытую форму номером страницы.
Затем скрипт отправляет форму, которая выполняет POST-запрос на сервер.
Сервер отвечает напрямую соответствующей страницей.

У вас есть несколько вариантов. Самый простой — просто написать wgetзапрос --post-dataв цикле, чтобы получить все страницы от 1 до n. Обратитесь к документации и сетевому монитору вашего браузера, чтобы узнать, что на самом деле является запросом. Например, сетевой монитор Firefox говорит, что тело запроса выглядит следующим образом:

Content-Type: application/x-www-form-urlencoded
Content-Length: 145

pagingQuery=select+*+from+tblbabynames+where+++religion%3D%27hindu%27+and+gender%3D%27M%27+limit+0%2C30&totalRows=3097&pageNum=2&searchResultNo=0

Вероятно, вы можете заменить его pageNum=2в цикле.

Более сложным методом было бы использование инструментария автоматизации браузера, например Selenium, для буквальной навигации инажмитессылки, активирующие JS так же, как это сделал бы человек.

Answer 1