検索と正規表現を使った魔法の例

Question 1

のファイル(1)マニュアルページにはコマンドの実行方法しか記載されていません。マジックパターンの説明については、魔法(5)ただし、のセクションはregex特に詳細ではありません。に付属するパターンファイルには、その使用例が幅広く記載されています。 https://github.com/file/file/tree/master/magic/Magdir

主な問題は、キャレットをエスケープする必要があることです。\^行頭、\\^リテラルなどです^。エスケープされていないものにどのような特別な意味があるかはわかりません^。スペースもエスケープできるため、パターンが少し読みやすくなります。

狭い範囲の行に一致を限定したい場合、オプション（パターンの後ではなく単語の後）regexを指定し、検索範囲を限定します。/<length>regex終了長さの後にが続く場合l、バイトではなく行を意味します。私のテストでは、は/1l空行にのみ一致します。空でない行では、正確な開始オフセットを使用している場合でも、少なくともが必要です/2l。

のために始める検索の最後の行は、offsetであってもバイト数として解釈されますregex。（バージョン5.19より前のドキュメントでは、これは「行数」として解釈されると説明されていましたが、この記述は削除された一致するコードが変更されていないため、それ以前でも正確であったか&0どうかは疑問です。) オフセットを使用して、前の一致の末尾から検索を開始できますが、前の一致が最初の行の途中で終了した場合は、大きな違いはありません。

offsetさらに、「行の先頭」は、それがファイル内の行の先頭であるかどうかに関係なく、「検索範囲の先頭」（つまり、から）にも一致します。

したがって、より厳密に一致させるには、すべての行にフルライン正規表現を使用し、&1次の一致でオフセットを使用して、前の改行をスキップし、期待どおりに動作するように適切な場所に配置します\^。これは、カスタムファイルの種類を識別するにはやりすぎかもしれません。

最後に、共通部分を繰り返す必要はありません。インデントのレベルは、>同じレベルの以前のパターンが失敗した場合にパターンを試行する必要があることを意味します。

これらすべてをまとめると次のようになります。

0       regex/2l        \^Project\ Units:.*$
>&1     regex/2l        \^Units\ &\ Scale.*$
>>&1    regex/1l        \^$
>>>&1   regex/2l        \^Object\ Point\ ID     Photo Modeler 2D export table   
>>>&1   regex/2l        \^Id,Name,Photos        Photo Modeler 3D export table

Answer