検索: 正規表現を使用して、パス内に特定のディレクトリ名があり、パス内に別の特定のディレクトリ名がないすべてのファイルを取得します。

Question 1

Inian が言ったように、必要ありません-regex(これは非標準であり、サポートする実装間で構文が大きく異なります-regex¹)。

そのためにを使用できますが、というディレクトリを入力しないように-path指示することもできます。これは、で後でフィルタリングするために、その中のすべてのファイルを検出するよりも効率的です。findbad-path

LC_ALL=C find . -name bad -prune -o -path '*/good/*.txt' -type f -print

(LC_ALL=Cしたがって、findの*ワイルドカードは、ロケールで有効な文字を形成しないバイトシーケンスを含むファイル名では動作しません)。

または、複数のフォルダー名の場合:

LC_ALL=C find . '(' -name bad -o -name worse ')' -prune -o \
  '(' -path '*/good/*' -o -path '*/better/*' ')' -name '*.txt' -type f -print

を使用するとzsh、次のこともできます。

set -o extendedglob # best in ~/.zshrc
print -rC1 -- (^bad/)#*.txt~^*/good/*(ND.)

print -rC1 -- (^(bad|worse)/)#*.txt~^*/(good|better)/*(ND.)

または、配列内のリストの場合:

good=(good better best)
bad=(bad worse worst)
print -rC1 -- (^(${(~j[|])bad})/)#*.txt~^*/(${(~j[|])good})/*(ND.)

にないと呼ばれるディレクトリに降りるかbad、または ( の場合のように効率は悪くなります-path '*/good/*' ! -path '*/bad/*'):

print -rC1 -- **/*.txt~*/bad/*~^*/good/*(ND.)

ではzsh -o extendedglob、~を除外する(論理和否定) グロブ演算子は^否定演算子ですが、#は正規表現のような 0 個以上の前のものです*。${(~j[|])array}は配列の要素をで結合し|、はのリテラル|ではなくグロブ演算子として扱われます。|~

ではzsh、の後に PCRE マッチングを使用できますset -o rematchpcre。

set -o rematchpcre
regex='^(?!.*/bad/).*/good/.*\.txt\Z'
print -rC1 -- **/*(ND.e['[[ $REPLY =~ $regex ]]'])

しかし、すべてのファイル (ディレクトリ内のファイルも含む) に対してシェルコードを評価すると、bad他のソリューションよりも大幅に遅くなる可能性があります。

また、PCRE (zsh globs とは異なり) は、ロケールで有効な文字を形成しないバイトシーケンスで動作を停止し、UTF-8 以外のマルチバイト文字セットをサポートしないことに注意してください。ロケールを上記Cのように修正するとfind、この特定のパターンの両方に対処できます。

[[ =~ ]]のように拡張正規表現マッチングのみを実行したい場合はbash、代わりに pcre モジュール ( zmodload zsh/pcre) をロードし、[[ -pcre-match ]]の代わりに[[ =~ ]]を使用して PCRE マッチングを実行することもできます。

または、次のようにフィルタリングすることもできますgrep -zP(GNUgrepまたは互換の場合):

regex='^(?!.*/bad/).*/good/.*\.txt\Z'
find . -type f -print0 |
  LC_ALL=C grep -zPe "$regex" |
  tr '\0' '\n'

(ただし、findすべてのディレクトリ内のすべてのファイルは検出されますbad)。

これらのファイルに対して何か操作を行う必要がある場合 (1 行に 1 つずつ印刷する以外)tr '\0' '\n'は、に置き換えます。xargs -r0 cmd

^{find¹ いずれにせよ、ルックアラウンド演算子に必要な、Perl のような正規表現や Vim のような正規表現をサポートする実装は知りません。}

Answer