
首先,這是我第一次處理 WARC 文件...
我有一個webarchive 文件,它似乎已損壞(以某種方式),我在Windows 上安裝了Safari,我得到了這個(同樣的事情發生在Mac上) ):
我嘗試使用 7-zip 打開,但它說這不是有效的存檔。
我嘗試這Ruby 腳本,但它也給了我一個錯誤...
我需要的是找到一種從存檔中提取文件的方法......有什麼建議嗎?
答案1
我實際上能夠在 Windows 10 上做到這一點。
從這裡安裝 Safari:http://www.techspot.com/downloads/4184-safari-for-windows.html(按一下「直接下載」),然後右鍵單擊您要開啟的 .webarchive 文件,指向「開啟方式」並選擇 Safari。
我建議選擇“Microsoft 列印到 PDF”作為印表機並將其另存為 PDF,但如果取消列印對話框,它會在 Safari 中打開。
信用:佩德羅爾比