比較不同時間點的單一網站/瀏覽會話

Question 1

如果您需要登入並執行某些操作，那麼使用wget或類似工具的靜態下載是不夠的。在這種情況下，我建議使用碳粉匣編寫所需操作的腳本，並轉儲所有網站內容以及回應。

基本想法是用您喜歡的語言（例如 Python、Javascript、Ruby...）編寫一個腳本，使用 Selenium Web 驅動程式來引導瀏覽器。該腳本執行登入操作、點擊元素等，一旦收到回應，您就可以儲存傳輸頁面的正文。 Python 的一個簡單範例是在這裡給出，以及一些顯示登入的程式碼這裡。

您必須透過迭代所有外部<script>標籤、下載其原始程式碼來擴展程式碼，或透過遍歷所有<img>標籤來下載圖像。透過這種方式，您可以輕鬆區分主要 HTML 程式碼，並查看所呼叫的腳本/圖像的各個檔案名稱。

另一種可能性是執行 Selenium 腳本瀏覽器Mob，可以匯出HAR文件。透過這種方式，您可以將自動化與自動轉儲所有內容結合。當然，然後您必須比較存在不同檢視器的 HAR 檔案。請注意，如果您希望 BrowserMob 能夠與 HTTPS 網站一起使用，則必須將中間人憑證與 BrowserMob 一起使用。

Answer

如果您需要登入並執行某些操作，那麼使用wget或類似工具的靜態下載是不夠的。在這種情況下，我建議使用碳粉匣編寫所需操作的腳本，並轉儲所有網站內容以及回應。

基本想法是用您喜歡的語言（例如 Python、Javascript、Ruby...）編寫一個腳本，使用 Selenium Web 驅動程式來引導瀏覽器。該腳本執行登入操作、點擊元素等，一旦收到回應，您就可以儲存傳輸頁面的正文。 Python 的一個簡單範例是在這裡給出，以及一些顯示登入的程式碼這裡。

您必須透過迭代所有外部<script>標籤、下載其原始程式碼來擴展程式碼，或透過遍歷所有<img>標籤來下載圖像。透過這種方式，您可以輕鬆區分主要 HTML 程式碼，並查看所呼叫的腳本/圖像的各個檔案名稱。

另一種可能性是執行 Selenium 腳本瀏覽器Mob，可以匯出HAR文件。透過這種方式，您可以將自動化與自動轉儲所有內容結合。當然，然後您必須比較存在不同檢視器的 HAR 檔案。請注意，如果您希望 BrowserMob 能夠與 HTTPS 網站一起使用，則必須將中間人憑證與 BrowserMob 一起使用。

Question 2

如果您想下載整個網站，請參閱文章最佳免費網站開膛手。

本文包含對幾個優秀 Ripper 的評論：HTTrack、PageNest、wget 等。我過去使用過 HTTrack，它對我很有用。

要追溯到更早的時間，您可以嘗試網路檔案回溯機試圖存檔整個網路。它會定期拍攝網站快照，因此您會找到多個版本進行比較。

為了捕獲流量，您將需要一個網路流量監視器。我可以推薦兩款優秀的產品： Wireshark 和微軟的泰勒里克提琴手。

Answer

如果您想下載整個網站，請參閱文章最佳免費網站開膛手。

本文包含對幾個優秀 Ripper 的評論：HTTrack、PageNest、wget 等。我過去使用過 HTTrack，它對我很有用。

要追溯到更早的時間，您可以嘗試網路檔案回溯機試圖存檔整個網路。它會定期拍攝網站快照，因此您會找到多個版本進行比較。

為了捕獲流量，您將需要一個網路流量監視器。我可以推薦兩款優秀的產品： Wireshark 和微軟的泰勒里克提琴手。

比較不同時間點的單一網站/瀏覽會話

答案1

答案2

相關內容