使用 Excel 從線上社群抓取 XPath 數據

Question

根據 Firefox/Firebug，用戶 Twitter URL 的唯一 XPath 是：

/html/body/div[2]/div/div/div[1]/div/div[2]/a[1]

這與您的第一次嘗試略有不同。注意：我已經修改了我的第一次嘗試，您不希望/i最後出現，或者您得到的是內部元素而不是<a>帶有 url 的。

但是，您的第二次嘗試肯定會找到包含 URL 的正確 HTML 元素，而且它更加可靠。

您的第三次嘗試不適用於 XPathOnUrl，儘管它適用於 Google Docs ImportXML，因為它不支援屬性語法。

Answer 1

根據 Firefox/Firebug，用戶 Twitter URL 的唯一 XPath 是：

/html/body/div[2]/div/div/div[1]/div/div[2]/a[1]

這與您的第一次嘗試略有不同。注意：我已經修改了我的第一次嘗試，您不希望/i最後出現，或者您得到的是內部元素而不是<a>帶有 url 的。

但是，您的第二次嘗試肯定會找到包含 URL 的正確 HTML 元素，而且它更加可靠。

您的第三次嘗試不適用於 XPathOnUrl，儘管它適用於 Google Docs ImportXML，因為它不支援屬性語法。

相關內容