在尊重 robots.txt 的同時，我需要多少硬碟空間來快取網路？

Question 1

網路檔案確實像您提到的那樣對網路進行索引，但據我所知，僅保留網站，而不保留文件。他們確實保留了舊版本的網站索引，因此他們對空間的需求可能會大得多。在他們的常見問題中，他們談到了該任務所需的 2 PB 空間（http://www.archive.org/about/faqs.php#9）和大約數百台 Linux 伺服器，每台保存大約 1TB 的資料。那應該是一些數字，這應該會給你一個第一印象。

Answer

網路檔案確實像您提到的那樣對網路進行索引，但據我所知，僅保留網站，而不保留文件。他們確實保留了舊版本的網站索引，因此他們對空間的需求可能會大得多。在他們的常見問題中，他們談到了該任務所需的 2 PB 空間（http://www.archive.org/about/faqs.php#9）和大約數百台 Linux 伺服器，每台保存大約 1TB 的資料。那應該是一些數字，這應該會給你一個第一印象。

Question 2

2008年，Google索引了1,000,000,000,000個頁面，如果一個網頁平均為1Ko，那麼這是1000To
平均1ko標準頁面只是一個非常低的估計..有PDF做巨大的尺寸...

祝你好運

Answer

2008年，Google索引了1,000,000,000,000個頁面，如果一個網頁平均為1Ko，那麼這是1000To
平均1ko標準頁面只是一個非常低的估計..有PDF做巨大的尺寸...

祝你好運

Question 3

我懷疑，當您添加描述等內容時，僅一個索引就會平均每頁運行一千字節。

Answer

我懷疑，當您添加描述等內容時，僅一個索引就會平均每頁運行一千字節。

在尊重 robots.txt 的同時，我需要多少硬碟空間來快取網路？

答案1

答案2

答案3

相關內容