Anfragen pro Sekunde zwischen einem Webbrowser und einem Web Scrapper

Question

Die Gründe, warum Web Scraper (nicht Scrapper) eine Verzögerung verwenden, sind:

um zu verbergen, dass sie das Web durchsuchen und von den Websites, die sie durchsuchen, ausgeschlossen zu werden (durch die Verwendung von kurzen Verzögerungen zwischen den Seiten sehen sie eher aus wie ein Webbrowser, der von einem Menschen bedient wird, der im Internet surft)
aus Rücksicht auf den Eigentümer der Website (das Anfordern großer Datenmengen in sehr kurzer Zeit kann den Server überlasten und dazu führen, dass die Website für andere Benutzer nicht mehr reagiert)

Wenn Ihr Browser (oder ein Web Scraper) eine Seite anfordert, muss er nicht eine ganze Sekunde warten, bevor er Objekte auf derselben Seite anfordert. Er kann sie sofort anfordern – dies führt zu einer besseren Benutzererfahrung (schnelleres Laden der Seite).

Was ein „normaler“ Benutzer nicht tun wird, ist, innerhalb eines sehr kurzen Zeitraums verschiedene Seiten anzufordern. Ein Benutzer sieht sich eine Seite an, klickt auf einen Link, um zur nächsten Seite zu gelangen usw.
Wenn ein Benutzer also eine Site durchsucht, kommt es zu einer Verzögerung zwischen dem Anfordern verschiedener Seiten derselben Website. Dies ist sehr wahrscheinlich die 1-Sekunden-Verzögerung, die Sie in Ihrer Frage erwähnt haben.

Um eine Site schnell zu scrapen, möchten Web Scraper natürlich die kürzestmögliche Verzögerung nutzen. Sie verwenden verschiedene Möglichkeiten, um den Prozess zu beschleunigen (z. B. mehrere Sites parallel scrapen; es so aussehen lassen, als ob die Anfragen von mehreren verschiedenen Benutzern stammen).
Für Web Scraper gibt es immer einen Kompromiss zwischen den Gründen für eine Verzögerung und der Notwendigkeit, die Arbeit zu erledigen.

Weitere Informationen finden Sie im Eintrag aufWikipedia

Answer 1