![Фрейм веб-скрапинга в пределах htm;](https://rvso.com/image/1505652/%D0%A4%D1%80%D0%B5%D0%B9%D0%BC%20%D0%B2%D0%B5%D0%B1-%D1%81%D0%BA%D1%80%D0%B0%D0%BF%D0%B8%D0%BD%D0%B3%D0%B0%20%D0%B2%20%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B0%D1%85%20htm%3B.png)
Я новичок в веб-скрапинге. Я пытаюсь скрафтить связанную информацию вhttps://www.harris.com/careers/jobsдля каждой должности. Информация содержится в следующем XPath: //*[@id="frmJobs"]. Я использую плагин Chrome "Scraper". Плагин не может выбрать фрейм, используя все доступные селекторы. Мне интересно, есть ли простой способ создать карту сайта, которая попадет внутрь фрейма и извлечет всю связанную информацию. Пожалуйста, дайте мне знать, возможно ли это вообще.
решение1
Ну, я попробовал Octoparse, инструмент для веб-скрейпинга, чтобы извлечь данные фрейма, и я получил всю информацию, которую хотел. Я ввожу, например, "общественное здравоохранение" в текстовое поле, чтобы найти вакансии и извлечь эти результаты. Я загружаю файл .otdэто правило конфигурации с использованием Octoparse для извлечения рабочих мест в сфере общественного здравоохранения. Результаты сокращения рабочих мест в сфере общественного здравоохранения показаны ниже.