將兩個連續的 CR 替換為一個

將兩個連續的 CR 替換為一個

cat -e file.txt給出:

{"yellow":"mango"}^M$
^M$
{"yellow":"banana"}^M$
^M$
{"yellow":"blabla"}^M$
^M$

我想要:

{""yellow":"mango"}^M$
{"yellow":"banana"}^M$
{"yellow":"blabla"}^M$

適用於資料夾中所有具有 txt 副檔名的檔案。所以我嘗試:

find . -type f -name "*.txt" -print0 | xargs -0 sed -i "s/^M$^M$/^M$/g"

無濟於事。有人有更好的點子嗎?

head -n 3 file.txt | od -bc

產量:

0000000 173 042 171 145 154 154 157 167 042 072 042 155 141 156 147 157
          {   "   y   e   l   l   o   w   "   :   "   m   a   n   g   o
0000020 042 175 015 012 015 012 173 042 142 141 142 141 142 042 072 042
          "   }  \r  \n  \r  \n   {   "   b   a   b   a   b   "   :   "
0000040 155 141 156 147 157 042 175 015 012
          m   a   n   g   o   "   }  \r  \n
0000051

這:

awk 1 RS='\r\n' ORS= < file.txt

完全刪除新行(所以這不好:我想在每行上保留連續兩行之一,但它做了一些事情)。

答案1

您可以使用sed -z 's/\r\n\r\n/\r\n/g'

通常sed一次只能在一行上運行。透過使用該-z選項,sed將在以位元組分隔的行上工作0,這些行通常不存在於文字檔案中,因此整個檔案將被視為一行,並且可以替換換行符。

(發現於堆疊溢位並添加了解釋)

答案2

您也可以刪除僅包含回車符的行。

  • 使用 GNU Sed:

    sed '/^\r$/d' file
    
  • 對於最小但相容 POSIX 的機器(這裡我們需要使用 Printf 產生回車符):

    sed "/^$(printf "\r")$/d" file
    

^配對行首和最後一個$、行尾 ( \n)。

例如:

$ cat -e file
AB^M$
^M$
CB^M$
^M$
$ sed '/^\r$/d' file|cat -e
AB^M$
CB^M$

答案3

如果可以刪除所有空白行,您可以執行以下操作:

perl -wlne '/\S/ and print' old_file > new_file

如果您想覆蓋文件,可以使用-i(就地)開關:

perl -wlni.bak -e '/\S/ and print' file1 file2 file3 ...

上面的行會將原始檔案複製為*.bak檔案。如果您不關心備份,那麼您可以省略該.bak部分,如下所示:

perl -wlni -e '/\S/ and print' file1 file2 file3 ...

(您甚至可以使用通配符,因此file1 file2 file3 ...您可以編寫file*。)

這種方法的優點是它可以一次對所有文件進行更改(而不是必須為每個文件運行一次)。

但請記住:這只會保留至少包含一個非空白字元的行。因此,如果一行僅包含五個空格、一個製表符、一個回車符和一個換行符,則不會保留該行。

答案4

使用 Raku(以前稱為 Perl6 的語言)

~$ raku -ne '.put if /\S/ ;' test_blank.txt
{"yellow":"mango"}
{"yellow":"banana"}
{"yellow":"blabla"}

上面的範例僅列印包含非空白字元的行(\S符合非空白的單一字元)。下面是一個非常可讀的版本:

~$ raku -ne '.put if .chars;' test_blank.txt
{"yellow":"mango"}
{"yellow":"banana"}
{"yellow":"blabla"}

HTH。

https://raku.org
https://rakudo.org/downloads

相關內容