Preciso extrair o texto entre dois cabeçalhos, se o primeiro corresponder a um arquivo fonte para pesquisar os cabeçalhos a serem pesquisados, exemplo:
&Header1
1231241241313124123213123214124123213213124124123123212
1231231231231231231231231231232131242141241241231325552
2132141241232132132132141251232132142142132132132142412
&Header2
1231241241313124123213123214124123213213124124123123212
2132141241232132132132141251232132142142132132132142412
&Header3
1231241241313124123213123214124123213213124124123123212
1231231231231231231231231231232131242141241241231325552
213214124123213213213214125123213214
E meu arquivo fonte:
&Header1
&Header3
Portanto, recupere apenas os cabeçalhos 1 e 3 com as informações numéricas abaixo.
Responder1
startheader=$(head -1 sourcefile)
endheader=$(tail -1 sourcefile)
# above lines assume your sourcefile has two lines in it and
# each line contains the starting header and ending header
startlinenumber=$(grep -n "${startheader}" datafile|cut -d: -f1)
endlinenumber=$(grep -n "${endheader}" datafile|cut -d: -f1)
sed -n -e "${startlinenumber},${endlinenumber}p" datafile
Tenho certeza de que existe uma maneira mais elaborada de fazer isso com um awk
ou perl
talvez um único sed
comando de linha, mas eu só queria fornecer a lógica explicitamente. Você pode brincar com ele e adaptá-lo às suas necessidades.