使用 cut 排除封閉的分隔符

Question 1

Perl 附帶的 ParseWords 模組非常優雅地涵蓋了這一點。下面的例子。

$ perl -MText::ParseWords -nE '@a=quotewords ",",1,$_;say $a[0],",",$a[1]' <test.txt
"col1","col2"
"col4","col5,subtext"
$

Answer

Perl 附帶的 ParseWords 模組非常優雅地涵蓋了這一點。下面的例子。

$ perl -MText::ParseWords -nE '@a=quotewords ",",1,$_;say $a[0],",",$a[1]' <test.txt
"col1","col2"
"col4","col5,subtext"
$

Question 2

如果您有gawkv4 可用，則有一個很好的解決方案使用 awk 解析 csv 並忽略字段內的逗號

例子：

gawk -vFPAT='[^,]*|"[^"]*"' '{print $1 "," $2}' test.txt

Answer

如果您有gawkv4 可用，則有一個很好的解決方案使用 awk 解析 csv 並忽略字段內的逗號

例子：

gawk -vFPAT='[^,]*|"[^"]*"' '{print $1 "," $2}' test.txt

Question 3

另一種perl解決方案，假設所有欄位都被引用

$ perl -F'/"\K,(?=")/' -lane 'print "$F[0],$F[1]"' test.txt 
"col1","col2"
"col4","col5,subtext"

grep也可以用

$ grep -oE '^"[^"]*","[^"]*"' test.txt 
"col1","col2"
"col4","col5,subtext"

如果需要 N 個字段，請使用裡面的grep -oE '^("[^"]*",){1}"[^"]*"'數字{}N-1

Answer

另一種perl解決方案，假設所有欄位都被引用

$ perl -F'/"\K,(?=")/' -lane 'print "$F[0],$F[1]"' test.txt 
"col1","col2"
"col4","col5,subtext"

grep也可以用

$ grep -oE '^"[^"]*","[^"]*"' test.txt 
"col1","col2"
"col4","col5,subtext"

如果需要 N 個字段，請使用裡面的grep -oE '^("[^"]*",){1}"[^"]*"'數字{}N-1

Question 4

你也可以用 awk 嘗試一下，如下所示；

awk -F'","'  '{printf "%s\",\"%s\"\n", $1, $2 }' test.txt

例如;

user@host$ awk -F'","'  '{printf "%s\",\"%s\"\n", $1, $2 }' test.txt 
"col1","col2"
"col4","col5,subtext"

Answer

你也可以用 awk 嘗試一下，如下所示；

awk -F'","'  '{printf "%s\",\"%s\"\n", $1, $2 }' test.txt

例如;

user@host$ awk -F'","'  '{printf "%s\",\"%s\"\n", $1, $2 }' test.txt 
"col1","col2"
"col4","col5,subtext"

相關內容