sed を使用して CSV ファイル内の二重引用符内のカンマを置換する

Question 1

csv ファイルは非常に扱いにくい場合があります。行のどこかにエスケープされた引用符が含まれ、それを処理する正規表現が判読不能になり、エラーが発生しやすくなります。

私は次のようなツールをお勧めしますcskit さんまたは、Perl または Python の小さなスクリプト。Python で簡単に作成されたこのプログラムでそれが実現できるはずです。

import csv

with open('input.csv',mode='r') as csv_file:
   csv_reader = csv.reader(csv_file)
   for row in csv_reader:
       print (',').join([f.replace(',',';') for f in row])

Answer

csv ファイルは非常に扱いにくい場合があります。行のどこかにエスケープされた引用符が含まれ、それを処理する正規表現が判読不能になり、エラーが発生しやすくなります。

私は次のようなツールをお勧めしますcskit さんまたは、Perl または Python の小さなスクリプト。Python で簡単に作成されたこのプログラムでそれが実現できるはずです。

import csv

with open('input.csv',mode='r') as csv_file:
   csv_reader = csv.reader(csv_file)
   for row in csv_reader:
       print (',').join([f.replace(',',';') for f in row])

Question 2

@steeldriverがすでに述べたように、mysqlおそらく、正しい選択肢ただし、参考までに、awk でこれを行うことができます。

awk -v RS='"' -v ORS= 'NR % 2 || gsub(/,/,";") || 1'

12,name; brand - something; something,age,sex,,,,name; brand - something; something; something,,,,,

または、引用符をそのままにして次のようにします。

awk -v RS='"' -v ORS= '{if(NR % 2) print; else{gsub(/,/,";");print RS $0 RS}}'

12,"name; brand - something; something",age,sex,,,,"name; brand - something; something; something",,,,,

これは同じトリックを使用していますここ、元に戻すだけ：部分を変更する代わりに外引用文の部分を修正しています内部引用文。

Answer

@steeldriverがすでに述べたように、mysqlおそらく、正しい選択肢ただし、参考までに、awk でこれを行うことができます。

awk -v RS='"' -v ORS= 'NR % 2 || gsub(/,/,";") || 1'

12,name; brand - something; something,age,sex,,,,name; brand - something; something; something,,,,,

または、引用符をそのままにして次のようにします。

awk -v RS='"' -v ORS= '{if(NR % 2) print; else{gsub(/,/,";");print RS $0 RS}}'

12,"name; brand - something; something",age,sex,,,,"name; brand - something; something; something",,,,,

これは同じトリックを使用していますここ、元に戻すだけ：部分を変更する代わりに外引用文の部分を修正しています内部引用文。

Question 3

私が見つけた最良の答えは、次の行を追加して MySQL 自体を使用することです。

OPTIONALLY ENCLOSED BY '"'

たとえば、ロードクエリは次のようになります。

LOAD DATA INFILE 'filename.csv' INTO TABLE table_name 
  FIELDS TERMINATED BY ',' 
  OPTIONALLY ENCLOSED BY '"'
  IGNORE 1 LINES;

Answer

私が見つけた最良の答えは、次の行を追加して MySQL 自体を使用することです。

OPTIONALLY ENCLOSED BY '"'

たとえば、ロードクエリは次のようになります。

LOAD DATA INFILE 'filename.csv' INTO TABLE table_name 
  FIELDS TERMINATED BY ',' 
  OPTIONALLY ENCLOSED BY '"'
  IGNORE 1 LINES;

sed を使用して CSV ファイル内の二重引用符内のカンマを置換する

答え1

答え2

答え3

関連情報