Estou tentando aprender analisadores de arquivos usando shell script e tenho meu arquivo de entrada
input.txt
como
int A[4]; /* 0 16*/
char B[15]; /* 16 31*/
/* Padding may be required here */
long int C[2]; /*32 8*/
Existe uma maneira de analisar o texto acima input.txt
no formato desejado, que se parece com este output.txt
arquivo de saída:
0,int, A[4], 0, 16
1,char, B[16], 16,31
2,long int, C[2], 32, 8
Responder1
Sua entrada parece ser semelhante a C, então seria melhor, em teoria, analisá-la com um analisador C. Se você usar expressões regulares, mesmo para tarefas simples, terá que lidar com espaços variados, entradas multilinhas, etc. O problema é que os analisadores C não analisam comentários e aparentemente você deseja fazê-lo.
Aqui está um script perl que fornece a saída esperada para sua amostra.
#!/usr/bin/perl -n
#
BEGIN { $i = 0; }
if (m!^\s*(.+)\s+([^ ]+);\s*/\*\s*(\d+)\s*(\d+)\s*\*/\s*$!)
{
print "$i,$1,$2,$3,$4\n";
$i+=1
}
Se você salvar este script como script.pl
na pasta onde input.txt
está, use-o assim:
./script.pl < input.txt > output.txt
Responder2
Uma alternativa estranha sem regex:
$ echo "int A[4]; /* 0 16*/" |awk '{gsub(/[/*;]/,"");for (i=1;i<=NF;i++) printf("%s, %s", (i==1?NR-1:""),(i==NF?$i"\n":$i))}'
#Output:
0, int, A[4], 0, 16
Armadilha:
$ echo "long int C[2]; /*32 8*/" |awk '{gsub(/[/*;]/,"");for (i=1;i<=NF;i++) printf("%s, %s", (i==1?NR-1:""),(i==NF?$i"\n":$i))}'
#Output
0, long, int, C[2], 32, 8
Responder3
perl -lane '
/^\s*\/\*/ and $,=",",next;
print $a++,join ", ", grep /./, map { m!^/\*+\K(\S*)|([^*]*)(?=\*+/$)|(.+[^;]);?$! } @F
'