囲まれた区切り文字をカットで除外する

Question 1

Perl に同梱されている ParseWords モジュールは、これを非常にエレガントにカバーします。以下に例を示します。

$ perl -MText::ParseWords -nE '@a=quotewords ",",1,$_;say $a[0],",",$a[1]' <test.txt
"col1","col2"
"col4","col5,subtext"
$

Answer

Perl に同梱されている ParseWords モジュールは、これを非常にエレガントにカバーします。以下に例を示します。

$ perl -MText::ParseWords -nE '@a=quotewords ",",1,$_;say $a[0],",",$a[1]' <test.txt
"col1","col2"
"col4","col5,subtext"
$

Question 2

例：

gawk -vFPAT='[^,]*|"[^"]*"' '{print $1 "," $2}' test.txt

Answer

例：

gawk -vFPAT='[^,]*|"[^"]*"' '{print $1 "," $2}' test.txt

Question 3

perlすべてのフィールドが引用符で囲まれていると仮定した別の解決策

$ perl -F'/"\K,(?=")/' -lane 'print "$F[0],$F[1]"' test.txt 
"col1","col2"
"col4","col5,subtext"

grepもできます

$ grep -oE '^"[^"]*","[^"]*"' test.txt 
"col1","col2"
"col4","col5,subtext"

N個のフィールドが必要な場合は、grep -oE '^("[^"]*",){1}"[^"]*"'内部の数字{}がN-1

Answer

perlすべてのフィールドが引用符で囲まれていると仮定した別の解決策

$ perl -F'/"\K,(?=")/' -lane 'print "$F[0],$F[1]"' test.txt 
"col1","col2"
"col4","col5,subtext"

grepもできます

$ grep -oE '^"[^"]*","[^"]*"' test.txt 
"col1","col2"
"col4","col5,subtext"

N個のフィールドが必要な場合は、grep -oE '^("[^"]*",){1}"[^"]*"'内部の数字{}がN-1

Question 4

以下のように awk でこれを試すこともできます。

awk -F'","'  '{printf "%s\",\"%s\"\n", $1, $2 }' test.txt

例えば;

user@host$ awk -F'","'  '{printf "%s\",\"%s\"\n", $1, $2 }' test.txt 
"col1","col2"
"col4","col5,subtext"

Answer

以下のように awk でこれを試すこともできます。

awk -F'","'  '{printf "%s\",\"%s\"\n", $1, $2 }' test.txt

例えば;

user@host$ awk -F'","'  '{printf "%s\",\"%s\"\n", $1, $2 }' test.txt 
"col1","col2"
"col4","col5,subtext"

関連情報