Excel を使用したオンラインコミュニティからの XPath データスクレイピング

Question

Firefox/Firebug によると、ユーザーの Twitter URL への一意の XPath は次のとおりです。

/html/body/div[2]/div/div/div[1]/div/div[2]/a[1]

/iこれは最初の試みとは少し異なります。注意: 最初の試みを修正しました。末尾にを付けないでください。そうしないと、 <a>URL が付いたではなく、内部要素が取得されます。

しかし、2 回目の試行では、URL を含む正しい HTML 要素が確実に見つかるため、より堅牢になります。

3 回目の試みは、属性構文をサポートしていないため、Google Docs ImportXML では機能しますが、XPathOnUrl では機能しません。

Answer 1

Firefox/Firebug によると、ユーザーの Twitter URL への一意の XPath は次のとおりです。

/html/body/div[2]/div/div/div[1]/div/div[2]/a[1]

/iこれは最初の試みとは少し異なります。注意: 最初の試みを修正しました。末尾にを付けないでください。そうしないと、 <a>URL が付いたではなく、内部要素が取得されます。

しかし、2 回目の試行では、URL を含む正しい HTML 要素が確実に見つかるため、より堅牢になります。

3 回目の試みは、属性構文をサポートしていないため、Google Docs ImportXML では機能しますが、XPathOnUrl では機能しません。

関連情報