htm 内の Web スクレイピング フレーム。

htm 内の Web スクレイピング フレーム。

私はウェブスクレイピングの初心者です。リンクされた情報をスクレイピングしようとしています。https://www.harris.com/careers/jobs各職位について。情報は、次の XPath 内に含まれています: //*[@id="frmJobs"]。私は Chrome の「Scraper」プラグインを使用しています。このプラグインは、使用可能なすべてのセレクターを使用してフレームを選択することはできません。フレーム内に入ってリンクされたすべての情報を抽出するサイトマップを簡単に作成する方法があるかどうか知りたいです。これが可能かどうか教えてください。

答え1

さて、私はフレームデータを抽出するためのWebスクレイピングツールであるOctoparseを試してみましたが、必要な情報はすべて取得できました。たとえば、テキストボックスに「公衆衛生」と入力して求人を検索し、その結果を抽出します。.otdファイルをアップロードします。それはOctoparseを使用して公衆衛生の仕事を抽出するための構成ルールです公衆衛生の仕事を抽出した結果を以下に示します。

関連情報