如何從偏移量處開始處理檔案？

Question 1

假設您的資料按時間順序排列：

Answer

假設您的資料按時間順序排列：

Question 2

您可以dd按照以下方式使用：

dd if=log skip=xK bs=1M

這將跳過 x * 1024 個大小為 1M (2^20) 的區塊。dd(1)有關單位處理的詳細信息，請參見參考資料。

如果您想自動進行二分搜索，假設您的日誌具有通常的格式，<date> [data]您可以將輸出通過管道傳輸到head -n 2，請檢查日誌開頭的日期第二線（在“通常”長線的合理假設下 - 將完成）並決定您想要哪一半。

Answer

您可以dd按照以下方式使用：

dd if=log skip=xK bs=1M

這將跳過 x * 1024 個大小為 1M (2^20) 的區塊。dd(1)有關單位處理的詳細信息，請參見參考資料。

如果您想自動進行二分搜索，假設您的日誌具有通常的格式，<date> [data]您可以將輸出通過管道傳輸到head -n 2，請檢查日誌開頭的日期第二線（在“通常”長線的合理假設下 - 將完成）並決定您想要哪一半。

Question 3

取得檔案大小並除以 2。（或 1024*1024 以獲得 MiB 等）

((fs = $(stat -c %s logfile) / 2 / 1024))

跳過並蒐索

dd if=logfile bs=1024 skip=$fs | grep blahblah

如果日誌檔案是，您可以進一步擴展這一點非常與 pr 的資料量一致。天透過加一個count=值到dd.

((cnt = $(stat -c %s logfile) / 5 / 1024))

dd if=logfile bs=1024 skip=$fs count=$cnt | grep blahblah

這將cnt * 1024在偏移位元組處傳輸資料位元組fs * 1024。

將其全部包裝在一個腳本中，並在腳本外部執行管道連接到 grep、臨時檔案或您想要的任何內容。

Answer