2 つの一致文字列のいずれかが一致する場合に行を抽出するにはどうすればよいでしょうか?

Question 1

ここでは、次の操作を実行できます。

cut -d _ -f 2 < country.txt

または、入力に_文字のない行が含まれる場合:

awk -F _ 'NF >= 2 {print $2}' < country.txt

国名に文字が含まれている可能性があり、代わりに最初の文字と最初の文字の間またはその後の_行の部分を返したい場合は、次のようにします。__raw_clean

perl -ne 'print $1 if s/^[^_]*_(.*?)_(clean|raw)/' < country.txt

あるいはGNUの場合grep:

grep -Po '^[^_]*_\K.*?(?=_clean|_raw)' < country.txt

を使用する場合-P（がgrepPCRE サポート付きでビルドされている場合）、正規表現は Perl 互換になります。これらの正規表現では、は\K一致した文字列の先頭をリセットし、(?=...)は先読み演算子です...。つまり、一致した部分にその部分が含まれずに、文字列の残りの部分が一致するかどうかを検索します。は一致した部分を出力-oします。そのため、ここではと非貪欲に同等である上記にgrep一致するものを出力します。つまり、0 個以上の文字のシーケンスで、この場合は行の先頭（）にある 0 個以上のアンダースコアのシーケンスの後にアンダースコアが続き、その後にまたはが続くものと想定します。.*?.*[^_]*^_raw_clean

を使用するとpcregrep、次のように書くこともできます。

pcregrep -o1 '^[^_]*_(.*?)_(clean|raw)'

を使用すると-o1、最初のに一致した部分が出力されます(...)。

Answer

テキスト処理にシェルループは使わない。