
タブ区切りのフィールドを含む .txt ファイルを受け取りました。ファイルには 65,000 を超えるレコードが含まれています。
ファイルを編集して、いくつかのレコードを削除したいです。具体的には、フィールドのいずれかに特定の単語 (たとえば「taffy」) を含むすべてのレコードを検索したいです。フィールドは「taffy」で始まる場合もそうでない場合もあります。フィールド内の 2 番目または 3 番目の単語である場合もあります。
私はこの .txt ファイルをスプレッドシートとして Apple Numbers にインポートしましたが、データベース アプリ (無料または安価) を使用してこれを行うこともできます。
最終結果は単純な参照テーブルとして使用され、スプレッドシートまたはデータベース ファイルのいずれかになります。
このファイルを検索し、結果に応じてレコードをグループ化し(フィールドの 1 つに「taffy」を含む)、複数選択して削除できるようにするアプリは何ですか?
検索機能でブール式または正規表現を使用できるアプリを探しているのでしょうか? また、検索結果に応じてレコードをグループ化できるアプリを探しています。
ありがとう、
答え1
ターミナルを起動し、コマンドを使用しますグレップ「Taffy」を含まない行をフィルタリングするには、次のようにします。
grep --invert --no-filename taffy input_file.txt > output_file.txt
output_file.txt
これにより、taffy を含む行のない新しいファイル ( ) が作成されます。
もう一つの便利なオプションは、 オプションです--ignore-case
。
説明:
--invert
行を選択するない検索式を含む--no-filename
出力の一部としてファイル名を抑制します--ignore-case
検索文字列の大文字と小文字は無視されます。Taffy、tAfFy、taffy、TAFFY はすべて一致します。>
コマンドの出力をファイルにリダイレクトします。