オフセットでファイルの処理を開始するにはどうすればよいでしょうか?

Question 1

データが時系列順に並んでいると仮定します。

末尾までシークして、次のように実行してファイルのサイズを取得しますftell()。
その結果を2で割ります。
fseek()その場所を探すために使用します。
getline()一度呼び出すと次の行の先頭に移動します。
strptime()現在何日であるかを確認するために使用します。
バイナリ検索を実行し、必要な行が見つかるまで手順 4 と 5 を繰り返します。

Answer

データが時系列順に並んでいると仮定します。

末尾までシークして、次のように実行してファイルのサイズを取得しますftell()。
その結果を2で割ります。
fseek()その場所を探すために使用します。
getline()一度呼び出すと次の行の先頭に移動します。
strptime()現在何日であるかを確認するために使用します。
バイナリ検索を実行し、必要な行が見つかるまで手順 4 と 5 を繰り返します。

Question 2

dd次のようなものを使用できます:

dd if=log skip=xK bs=1M

これは、サイズが 1M (2^20) の x * 1024 ブロックをスキップします。dd(1)単位の処理の詳細については、を参照してください。

バイナリ検索を自動化したい場合は、ログが通常の形式であれば、<date> [data]出力をパイプすることができますhead -n 2。2番行 (「通常」長い行という合理的な仮定の下では、完全な行になります) を選択し、必要な半分を決定します。

Answer

dd次のようなものを使用できます:

dd if=log skip=xK bs=1M

これは、サイズが 1M (2^20) の x * 1024 ブロックをスキップします。dd(1)単位の処理の詳細については、を参照してください。

バイナリ検索を自動化したい場合は、ログが通常の形式であれば、<date> [data]出力をパイプすることができますhead -n 2。2番行 (「通常」長い行という合理的な仮定の下では、完全な行になります) を選択し、必要な半分を決定します。

Question 3

ファイルサイズを取得して 2 で割ります。それを 1024 で割ると KiB になります。(または 1024*1024 で MiB などになります。)

((fs = $(stat -c %s logfile) / 2 / 1024))

スキップして検索

dd if=logfile bs=1024 skip=$fs | grep blahblah

ログファイルがとてもcount=に値を追加することで、1 日あたりのデータ量と一致しますdd。

((cnt = $(stat -c %s logfile) / 5 / 1024))

dd if=logfile bs=1024 skip=$fs count=$cnt | grep blahblah

これにより、cnt * 1024オフセットバイトのデータのバイトがパイプされますfs * 1024。

すべてをスクリプトにラップし、スクリプトの外部で grep、一時ファイルなど、必要なものにパイプします。

Answer