替換大檔案中包含換行符的字串

Question 1

這在 Perl 中確實是微不足道的，你不應該討厭它！

perl -i.bak -pe 's/>\n/>/' file

這是一種awk方法：

awk  '{if(/>$/){printf "%s",$0}else{print}}' file2

Answer

這在 Perl 中確實是微不足道的，你不應該討厭它！

perl -i.bak -pe 's/>\n/>/' file

這是一種awk方法：

awk  '{if(/>$/){printf "%s",$0}else{print}}' file2

Question 2

一個perl辦法：

$ perl -pe 's/(?<=>)\n//'

說明

整個模式意味著刪除>之前的所有換行符。

Answer

一個perl辦法：

$ perl -pe 's/(?<=>)\n//'

說明

整個模式意味著刪除>之前的所有換行符。

Question 3

這個怎麼樣：

sed ':loop
  />$/ { N
    s/\n//
    b loop
  }' file

對於 GNU sed，您也可以嘗試根據問題新增-u( ) 選項。 --unbufferedGNU sed 也很高興將此作為一個簡單的單行程式碼：

sed ':loop />$/ { N; s/\n//; b loop }' file

Answer

這個怎麼樣：

sed ':loop
  />$/ { N
    s/\n//
    b loop
  }' file

對於 GNU sed，您也可以嘗試根據問題新增-u( ) 選項。 --unbufferedGNU sed 也很高興將此作為一個簡單的單行程式碼：

sed ':loop />$/ { N; s/\n//; b loop }' file

Question 4

sed不提供在沒有最終換行符的情況下發出輸出的方法。您使用的方法N從根本上有效，但在記憶體中儲存不完整的行，因此如果行變得太長，則可能會失敗（sed 實作通常不設計用於處理極長的行）。

您可以使用 awk 代替。

awk '{if (/<$/) printf "%s", $0; else print}'

另一種方法是使用tr「無聊」的頻繁出現的字元來交換換行符。空格在這裡可能會起作用 - 選擇一個往往出現在資料中的每一行或至少大部分行上的字元。

tr ' \n' '\n ' | sed 's/> />/g' | tr '\n ' ' \n'

Answer

sed不提供在沒有最終換行符的情況下發出輸出的方法。您使用的方法N從根本上有效，但在記憶體中儲存不完整的行，因此如果行變得太長，則可能會失敗（sed 實作通常不設計用於處理極長的行）。

您可以使用 awk 代替。

awk '{if (/<$/) printf "%s", $0; else print}'

另一種方法是使用tr「無聊」的頻繁出現的字元來交換換行符。空格在這裡可能會起作用 - 選擇一個往往出現在資料中的每一行或至少大部分行上的字元。

tr ' \n' '\n ' | sed 's/> />/g' | tr '\n ' ' \n'

相關內容