заменить пробелы и пустые ячейки в CSV-файле

Question 1

Ваш ответ:

sed 's/ *,/,/g' file1 | sed 's/,,/,NA,/g' > file2

Чтобы получить «NA» в последнем поле, если оно пустое:

sed 's/ *,/,/g' file1 | sed 's/,,/,NA,/g' | awk -F, 'OFS="," {if ($NF == "") $NF = "NA"; print}'> file2

Вы также можете использовать:

sed 's/,,/,NA,/g' file1 | tr -d ' ' | awk -F, 'OFS="," {if ($NF == "") $NF = "NA"; print}'

Answer

Ваш ответ:

sed 's/ *,/,/g' file1 | sed 's/,,/,NA,/g' > file2

Чтобы получить «NA» в последнем поле, если оно пустое:

sed 's/ *,/,/g' file1 | sed 's/,,/,NA,/g' | awk -F, 'OFS="," {if ($NF == "") $NF = "NA"; print}'> file2

Вы также можете использовать:

sed 's/,,/,NA,/g' file1 | tr -d ' ' | awk -F, 'OFS="," {if ($NF == "") $NF = "NA"; print}'

Question 2

Ответ αғsнιη мне помог, но я хотел бы немного его пояснить.

Я пытался сделать что-то вроде этого:

echo "1,,2,,,3,,,4,,,,5,,,,,,,,,,6" | sed 's/,,/,-,/g'

Какие выходы

1,-,2,-,,3,-,,4,-,,-,5,-,,-,,-,,-,,-,6

Из-за повторяющихся пустых полей последняя запятая является частью первой замены и началом следующей желаемой замены, поэтому вы просто заменяете каждое второе пустое поле.

Теперь вы можете сделать что-то вроде:

echo "1,,2,,,3,,,4,,,,5,,,,,,,,,,6" | sed -e 's/,,/,-,/g' -e 's/,,/,-,/g'

или

sed 's/,,/,-,/g;s/,,/,-,/g'

Что заменит все ячейки, так как вторая команда получит те, которые пропущены, но это немного запутанно.

Команда αғsнιη по сути делает то же самое, используя метку и переход, о возможности чего я не знал.

sed ':MYLABEL; s/,,/,-,/g; t MYLABEL;'

выход:

1,-,2,-,-,3,-,-,4,-,-,-,5,-,-,-,-,-,-,-,-,-,6

Итак, первая часть команды создает метку.

Затем у нас происходит та же самая замена.

Затем у нас есть команда t, которая означает переход к метке, если предыдущая команда подстановки была успешной.

Больше информации:http://www.grymoire.com/Unix/Sed.html#uh-59

Answer