Почему awk не игнорирует «пробел» как разделитель?

Question 1

Если я правильно вас понял, вы можете использовать цикл while и расширение переменной

while IFS= read -r line; do 
  id="${line%;*}"
  name="${line#*;}"
  cp sample.xml output/input.tmp
  sed -i -e "s/xxx/$id/g" output/input.tmp
  sed -i -e "s/yyy/$name/g" output/input.tmp
  mv output/input.tmp output/"$name".xml
done < file

Как предложил @steeldriver, вот (более элегантный) вариант:

while IFS=';' read -r id name; do 
  cp sample.xml output/input.tmp
  sed -i -e "s/xxx/$id/g" output/input.tmp
  sed -i -e "s/yyy/$name/g" output/input.tmp
  mv output/input.tmp output/"$name".xml
done < file

Answer

Если я правильно вас понял, вы можете использовать цикл while и расширение переменной

while IFS= read -r line; do 
  id="${line%;*}"
  name="${line#*;}"
  cp sample.xml output/input.tmp
  sed -i -e "s/xxx/$id/g" output/input.tmp
  sed -i -e "s/yyy/$name/g" output/input.tmp
  mv output/input.tmp output/"$name".xml
done < file

Как предложил @steeldriver, вот (более элегантный) вариант:

while IFS=';' read -r id name; do 
  cp sample.xml output/input.tmp
  sed -i -e "s/xxx/$id/g" output/input.tmp
  sed -i -e "s/yyy/$name/g" output/input.tmp
  mv output/input.tmp output/"$name".xml
done < file

Question 2

Цитата !!. Цитата в этой строке отсутствует:

mv output/input.tmp output/$name.xml

Должен быть:

mv output/input.tmp output/"$name".xml

чтобы избежать проблем с именем файла, содержащим пробелы.

И расширение $(cat list)разделяется (и дробится) оболочкой, которая также распадается на пространства.

Возможно, вы можете перейти на этот скрипт:

#!/bin/bash -x
rm -f output/*

inputfile=output/input.tmp

while read -r line
do
    id=${line%%;*}
    name=${line##*;}

    cp sample.xml "$inputfile"
    sed -i -e "s/xxx/$id/g" "$inputfile"
    sed -i -e "s/yyy/$name/g" "$inputfile"
    mv "$inputfile"  output/"$name".xml; echo

done <list

Answer

Цитата !!. Цитата в этой строке отсутствует:

mv output/input.tmp output/$name.xml

Должен быть:

mv output/input.tmp output/"$name".xml

чтобы избежать проблем с именем файла, содержащим пробелы.

И расширение $(cat list)разделяется (и дробится) оболочкой, которая также распадается на пространства.

Возможно, вы можете перейти на этот скрипт:

#!/bin/bash -x
rm -f output/*

inputfile=output/input.tmp

while read -r line
do
    id=${line%%;*}
    name=${line##*;}

    cp sample.xml "$inputfile"
    sed -i -e "s/xxx/$id/g" "$inputfile"
    sed -i -e "s/yyy/$name/g" "$inputfile"
    mv "$inputfile"  output/"$name".xml; echo

done <list

Question 3

Причина, по которой ваш awk не выдает ожидаемых результатов, заключается в способе, которым вы выполняете итерацию по файлу. При итерации с использованием for i in $(cat file), вы выполняете итерацию по словам (разделенным IFS), а не по строкам. Чтобы прочитать файл построчно, используйте while read:

while read -r line; do
    ...
done < file

Для получения дополнительной информации см. следующий раздел часто задаваемых вопросов по bash:Как можно прочитать файл (поток данных, переменную) построчно (и/или по полю)?

Answer

Причина, по которой ваш awk не выдает ожидаемых результатов, заключается в способе, которым вы выполняете итерацию по файлу. При итерации с использованием for i in $(cat file), вы выполняете итерацию по словам (разделенным IFS), а не по строкам. Чтобы прочитать файл построчно, используйте while read:

while read -r line; do
    ...
done < file

Для получения дополнительной информации см. следующий раздел часто задаваемых вопросов по bash:Как можно прочитать файл (поток данных, переменную) построчно (и/или по полю)?

Question 4

В качестве альтернативного подхода,вы можете сделать эту работу с помощью awkв 1 процессе, а не в 4 для каждой строки. Это, скорее всего, будет полезно, если в списке много строк, но sample.xml небольшой.

awk -F';' 'FNR==NR{x=x $0 RS; next} 
{t=x; gsub(/xxx/,$1,t); gsub(/yyy/,$2,t); f="output/"$2".xml"; printf "%s",t >f; close(f)}
' sample.xml list
# shown with unnecessary linebreaks for clarity, but you can put it all on one line

Если список содержит окончания строк CRLF (формат DOS или Windows), как прокомментировано в вашем Q, и вы не можете (легко) или не хотите сначала удалить их, awk может справиться и с этим; сразу после второй {вставки sub(/\r$/,"",$0);(или $2если вам так удобнее).

perl тоже может это делать (perl может делать почти все, что может awk), но немного более многословно, и хотя perl широко доступен, он не соответствует POSIX, как awk.

Answer

В качестве альтернативного подхода,вы можете сделать эту работу с помощью awkв 1 процессе, а не в 4 для каждой строки. Это, скорее всего, будет полезно, если в списке много строк, но sample.xml небольшой.

awk -F';' 'FNR==NR{x=x $0 RS; next} 
{t=x; gsub(/xxx/,$1,t); gsub(/yyy/,$2,t); f="output/"$2".xml"; printf "%s",t >f; close(f)}
' sample.xml list
# shown with unnecessary linebreaks for clarity, but you can put it all on one line

Если список содержит окончания строк CRLF (формат DOS или Windows), как прокомментировано в вашем Q, и вы не можете (легко) или не хотите сначала удалить их, awk может справиться и с этим; сразу после второй {вставки sub(/\r$/,"",$0);(или $2если вам так удобнее).

perl тоже может это делать (perl может делать почти все, что может awk), но немного более многословно, и хотя perl широко доступен, он не соответствует POSIX, как awk.

Почему awk не игнорирует «пробел» как разделитель?

решение1

решение2

решение3

решение4

Связанный контент