リストに基づいてsed置換（s///g）を行うにはどうすればいいですか？複数の単語を他の対応する単語と交換する必要があります

Question 1

代わりに以下を使用してくださいperl:

$ perl -ne '
  ++$nr;
  if ($nr == $.) {
    @w = split;
    $k{$w[0]} = $w[1];
  }
  else {
    for $i (keys %k) {
      s/(\[)$i(\])/$1.$k{$i}.$2/ge
    }
    print;
  }
  close ARGV if eof;
' key.txt essay.txt
Sentence 1 [source-one]. sentence two [source-one][source-two]. Sentence three[source-one][source-three]

Answer

代わりに以下を使用してくださいperl:

$ perl -ne '
  ++$nr;
  if ($nr == $.) {
    @w = split;
    $k{$w[0]} = $w[1];
  }
  else {
    for $i (keys %k) {
      s/(\[)$i(\])/$1.$k{$i}.$2/ge
    }
    print;
  }
  close ARGV if eof;
' key.txt essay.txt
Sentence 1 [source-one]. sentence two [source-one][source-two]. Sentence three[source-one][source-three]

Question 2

awkperlここでも効果的に同じことができるもう少しシンプルにただし、GNU 以外の実装では、(大きな?) テキストファイルを不必要に分割して CPU 時間を少し浪費する可能性があります。

awk 'NR==FNR{a["\\["$1"\\]"]="["$2"]";next} {for(k in a) gsub(k,a[k]);print}' key.txt essay.txt

あなたが頼んだので説明:

awkパターンとアクションのペアからなる「スクリプト」を受け取り、1 つ以上のファイル (または標準入力) から 1 レコードずつ読み取ります。デフォルトでは各レコードは 1 行で、各レコードはデフォルトで空白 (タブを含む) でフィールドに分割され、スクリプトが順番に適用されます (特に指示がない限り)。パターン (多くの場合、現在のレコードやそのフィールドを参照) をテストし、一致する場合はアクション (多くの場合、前述のレコードやフィールドに対して何らかの処理を実行します) を実行します。ここでは 2 つのファイルを指定しkey.txt essay.txt、その順序で 1 行ずつ読み取ります。スクリプトできるコマンドラインではなくファイルに記述することもできますが、ここではそうしないことを選択しました。
最初のパターンはですNR==FNR。NRは組み込み変数で、処理中のレコードの番号です。はFNR同様に現在の入力ファイル内のレコードの番号です。最初のファイル ( key.txt) ではこれらは等しくなりますが、2 番目のファイル (および他のファイル) ではこれらは等しくありません。
最初のアクションはです{a["\\["$1"\\]"]="["$2"]";next}。awkには「連想」または「ハッシュ」配列があり、arrayname[subexpr]はsubexpr文字列値式で、配列の要素を読み取りまたは設定します。$numberたとえば$1 $2、などはフィールドを参照し、$0はレコード全体を参照します。上記のとおり、このアクションはの行に対してのみ実行されるため、key.txtたとえばそのファイルの最後の行には$1があり3、$2はであり、これはの添え字との内容source-threeを持つ配列エントリを格納します。これらの値を選択した理由については、以下を参照してください。とはエスケープを使用する文字列リテラルで、実際の値はとですが、は単なるであり、間に演算子のない文字列オペランドは連結されます。最後にこのアクションが実行され、これはこのレコードのスクリプトの残りの部分をスキップし、ループの先頭に戻って次のレコードを開始することを意味します。\[3\][source-three]"\\[""\\]"\[\]"[" "]"[ ]next
2番目のパターンは空なので、2番目のファイルのすべての行に一致し、アクションを実行します{for(k in a) gsub(k,a[k]);print}。このfor(k in a)構造は、Bourne型シェルが行うのとほぼ同じようにループを作成しますfor i in this that other; do something with $i; doneが、ここではの値kが下付き文字配列のa。このような値ごとに、gsub(global replace) が実行され、指定された正規表現に一致するすべての一致が検索され、指定された文字列に置き換えられます。配列の添え字と内容 (上記) を選択したので、たとえばは\[3\]テキスト文字列に一致する正規表現で[3]、[source-three]はそのような一致ごとに置換するテキスト文字列です。は、デフォルトでgsub現在のレコードに対して動作します$0。内のすべての値に対してこの置換を行った後、がa実行され、printデフォルトでは$0必要な置換がすべて行われた状態で現在の状態が出力されます。

注: GNU awk (gawk) は、特に Linux では一般的ですが、汎用的ではありません。パターンや実行されるアクションにフィールド値が必要ない場合は、実際にはフィールド分割を行わないという最適化が行われます。他の実装では、少量の CPU 時間が無駄になる場合がありますが、cuonglm のperl方法でこれを回避できます。ただし、ファイルが巨大でない限り、これはおそらく気付かないでしょう。

Answer

awkperlここでも効果的に同じことができるもう少しシンプルにただし、GNU 以外の実装では、(大きな?) テキストファイルを不必要に分割して CPU 時間を少し浪費する可能性があります。

awk 'NR==FNR{a["\\["$1"\\]"]="["$2"]";next} {for(k in a) gsub(k,a[k]);print}' key.txt essay.txt

あなたが頼んだので説明:

awkパターンとアクションのペアからなる「スクリプト」を受け取り、1 つ以上のファイル (または標準入力) から 1 レコードずつ読み取ります。デフォルトでは各レコードは 1 行で、各レコードはデフォルトで空白 (タブを含む) でフィールドに分割され、スクリプトが順番に適用されます (特に指示がない限り)。パターン (多くの場合、現在のレコードやそのフィールドを参照) をテストし、一致する場合はアクション (多くの場合、前述のレコードやフィールドに対して何らかの処理を実行します) を実行します。ここでは 2 つのファイルを指定しkey.txt essay.txt、その順序で 1 行ずつ読み取ります。スクリプトできるコマンドラインではなくファイルに記述することもできますが、ここではそうしないことを選択しました。
最初のパターンはですNR==FNR。NRは組み込み変数で、処理中のレコードの番号です。はFNR同様に現在の入力ファイル内のレコードの番号です。最初のファイル ( key.txt) ではこれらは等しくなりますが、2 番目のファイル (および他のファイル) ではこれらは等しくありません。
最初のアクションはです{a["\\["$1"\\]"]="["$2"]";next}。awkには「連想」または「ハッシュ」配列があり、arrayname[subexpr]はsubexpr文字列値式で、配列の要素を読み取りまたは設定します。$numberたとえば$1 $2、などはフィールドを参照し、$0はレコード全体を参照します。上記のとおり、このアクションはの行に対してのみ実行されるため、key.txtたとえばそのファイルの最後の行には$1があり3、$2はであり、これはの添え字との内容source-threeを持つ配列エントリを格納します。これらの値を選択した理由については、以下を参照してください。とはエスケープを使用する文字列リテラルで、実際の値はとですが、は単なるであり、間に演算子のない文字列オペランドは連結されます。最後にこのアクションが実行され、これはこのレコードのスクリプトの残りの部分をスキップし、ループの先頭に戻って次のレコードを開始することを意味します。\[3\][source-three]"\\[""\\]"\[\]"[" "]"[ ]next
2番目のパターンは空なので、2番目のファイルのすべての行に一致し、アクションを実行します{for(k in a) gsub(k,a[k]);print}。このfor(k in a)構造は、Bourne型シェルが行うのとほぼ同じようにループを作成しますfor i in this that other; do something with $i; doneが、ここではの値kが下付き文字配列のa。このような値ごとに、gsub(global replace) が実行され、指定された正規表現に一致するすべての一致が検索され、指定された文字列に置き換えられます。配列の添え字と内容 (上記) を選択したので、たとえばは\[3\]テキスト文字列に一致する正規表現で[3]、[source-three]はそのような一致ごとに置換するテキスト文字列です。は、デフォルトでgsub現在のレコードに対して動作します$0。内のすべての値に対してこの置換を行った後、がa実行され、printデフォルトでは$0必要な置換がすべて行われた状態で現在の状態が出力されます。

注: GNU awk (gawk) は、特に Linux では一般的ですが、汎用的ではありません。パターンや実行されるアクションにフィールド値が必要ない場合は、実際にはフィールド分割を行わないという最適化が行われます。他の実装では、少量の CPU 時間が無駄になる場合がありますが、cuonglm のperl方法でこれを回避できます。ただし、ファイルが巨大でない限り、これはおそらく気付かないでしょう。

Question 3

bash$ sed -f  <( sed -rn 's#([0-9]+)\s+(.*)#s/\\[\1]/[\2]/g#p' key.txt ) essay.txt

Sentence 1 [source-one]. sentence two [source-one][source-two]. Sentence three[source-one][source-three].

Answer

bash$ sed -f  <( sed -rn 's#([0-9]+)\s+(.*)#s/\\[\1]/[\2]/g#p' key.txt ) essay.txt

Sentence 1 [source-one]. sentence two [source-one][source-two]. Sentence three[source-one][source-three].

Question 4

これを実現するには、ループ内でインプレース sed 置換を使用できます。

$ cp essay.txt Result.txt
$ while read n k; do sed -i "s/\[$n\]/\[$k\]/g" Result.txt; done < key.txt
$ cat Result.txt 
Sentence 1 [source-one]. sentence two [source-one][source-two]. Sentence three[source-one][source-three].

Answer

これを実現するには、ループ内でインプレース sed 置換を使用できます。

$ cp essay.txt Result.txt
$ while read n k; do sed -i "s/\[$n\]/\[$k\]/g" Result.txt; done < key.txt
$ cat Result.txt 
Sentence 1 [source-one]. sentence two [source-one][source-two]. Sentence three[source-one][source-three].

リストに基づいてsed置換（s///g）を行うにはどうすればいいですか？複数の単語を他の対応する単語と交換する必要があります

答え1

答え2

答え3

答え4

関連情報