Фрейм веб-скрапинга в пределах htm;

2024-7-17 • tag-icon

google-chrome google-chrome-extensions

Фрейм веб-скрапинга в пределах htm;

Я новичок в веб-скрапинге. Я пытаюсь скрафтить связанную информацию вhttps://www.harris.com/careers/jobsдля каждой должности. Информация содержится в следующем XPath: //*[@id="frmJobs"]. Я использую плагин Chrome "Scraper". Плагин не может выбрать фрейм, используя все доступные селекторы. Мне интересно, есть ли простой способ создать карту сайта, которая попадет внутрь фрейма и извлечет всю связанную информацию. Пожалуйста, дайте мне знать, возможно ли это вообще.

решение1

Ну, я попробовал Octoparse, инструмент для веб-скрейпинга, чтобы извлечь данные фрейма, и я получил всю информацию, которую хотел. Я ввожу, например, "общественное здравоохранение" в текстовое поле, чтобы найти вакансии и извлечь эти результаты. Я загружаю файл .otdэто правило конфигурации с использованием Octoparse для извлечения рабочих мест в сфере общественного здравоохранения. Результаты сокращения рабочих мест в сфере общественного здравоохранения показаны ниже.

Связанный контент