htm 내의 웹 스크래핑 프레임;

htm 내의 웹 스크래핑 프레임;

저는 웹 스크래핑을 처음 접했습니다. 링크된 정보를 긁어내려고 합니다.https://www.harris.com/careers/jobs각 직무별로. 정보는 다음 XPath에 포함됩니다: //*[@id="frmJobs"]. 저는 Chrome "Scraper" 플러그인을 사용하고 있습니다. 플러그인은 사용 가능한 모든 선택기를 사용하여 프레임을 선택할 수 없습니다. 프레임 내부에 들어가 링크된 모든 정보를 추출하는 사이트맵을 쉽게 만드는 방법이 있는지 궁금합니다. 이것이 가능한지 알려주십시오.

답변1

글쎄요, 프레임 데이터를 추출하기 위해 웹 스크래핑 도구인 Octoparse를 사용해봤는데 제가 원하는 정보를 모두 얻었습니다. 예를 들어 텍스트 상자에 "공중 보건"을 입력하여 채용정보를 검색하고 해당 결과를 추출합니다. .otd 파일을 업로드합니다이것이 Octoparse를 사용하여 공중보건 업무를 추출하는 구성 규칙입니다.. 보건직 일자리 추출 결과는 아래와 같습니다.

관련 정보