Web-Scraping-Frame innerhalb von HTM;

Web-Scraping-Frame innerhalb von HTM;

Ich bin neu im Web Scraping. Ich versuche, die verknüpften Informationen inhttps://www.harris.com/careers/jobsfür jede Stelle. Die Informationen sind im folgenden XPath enthalten: //*[@id="frmJobs"]. Ich verwende das Chrome-Plugin „Scraper“. Das Plugin kann den Frame nicht mit allen verfügbaren Selektoren auswählen. Ich frage mich, ob es eine einfache Möglichkeit gibt, eine Sitemap zu erstellen, die in den Frame gelangt und alle verknüpften Informationen extrahiert. Bitte lassen Sie mich wissen, ob dies überhaupt möglich ist.

Antwort1

Nun, ich habe Octoparse, das Web Scraping Tool, ausprobiert, um die Frame-Daten zu extrahieren, und habe alle gewünschten Informationen erhalten. Ich gebe beispielsweise „öffentliche Gesundheit“ in das Textfeld ein, um nach den Jobs zu suchen und diese Ergebnisse zu extrahieren. Ich lade die .otd-Datei hochdas ist die Konfigurationsregel, die Octoparse verwendet, um die Arbeitsplätze des öffentlichen Gesundheitswesens zu extrahieren. Die Ergebnisse der Ermittlung der Arbeitsplätze im öffentlichen Gesundheitswesen werden unten angezeigt.

verwandte Informationen