У меня есть файл с таким текстом:
AAAA
BBBB
CCCC
DDDD
1234
5678
9012
3456
EEEE
7890
и т. д...
И я хочу сопоставить буквенные строки с числовыми строками, чтобы они выглядели так:
AAAA 1234
BBBB 5678
CCCC 9012
DDDD 3456
EEEE 7890
Кто-нибудь знает простой способ добиться этого?
решение1
В awk
, сохраняя пустые строки, предполагая, что файл хорошо отформатирован, но можно добавить логику для проверки файла:
awk -v RS="" '{for(i=1; i<=NF; i++) a[i]=$i
getline
for(i=1; i<=NF; i++) print a[i] " " $i
print ""}' file
решение2
<input sed -nr '/^[A-Z]{4}$/,/^$/w out1
/^[0-9]{4}$/,/^$/w out2'
paste -d' ' out1 out2 |sed 's/^ $//'
или, в один шаг, без временных файлов
paste -d' ' <(sed -nr '/^[A-Z]{4}$/,/^$/p' input) \
<(sed -nr '/^[0-9]{4}$/,/^$/p' input) | sed 's/^ $//'
Последний sed
шаг удаляет разделитель на пустых строках, который вводится paste
...
решение3
Один из способов использования perl
:
Содержание script.pl
:
use warnings;
use strict;
## Check arguments.
die qq[Usage: perl $0 <input-file>\n] unless @ARGV == 1;
my (@alpha, @digit);
while ( <> ) {
## Omit blank lines.
next if m/\A\s*\Z/;
## Remove leading and trailing spaces.
s/\A\s*//;
s/\s*\Z//;
## Save alphanumeric fields and fields with
## only digits to different arrays.
if ( m/\A[[:alpha:]]+\Z/ ) {
push @alpha, $_;
}
elsif ( m/\A[[:digit:]]+\Z/ ) {
push @digit, $_;
}
}
## Get same positions from both arrays and print them
## in the same line.
for my $i ( 0 .. $#alpha ) {
printf qq[%s %s\n], $alpha[ $i ], $digit[ $i ];
}
Содержание infile
:
AAAA
BBBB
CCCC
DDDD
1234
5678
9012
3456
EEEE
7890
Запустите его так:
perl script.pl infile
И результат:
AAAA 1234
BBBB 5678
CCCC 9012
DDDD 3456
EEEE 7890
решение4
Если записи в порядке,
Разделите входные данные на буквенные и числовые, используя
grep
:grep "[[:alpha:]]\+" < file > alpha
grep "[[:digit:]]\+" < file > digit
Объедините два полученных файла
alpha
иdigit
, используяpaste
:paste alpha digit
(можно добавить-d " "
, чтобы вместо табуляции использовался пробел)