Как объединить текст буквенных строк с числовыми строками в оболочке?

Как объединить текст буквенных строк с числовыми строками в оболочке?

У меня есть файл с таким текстом:

AAAA
BBBB
CCCC
DDDD

1234
5678
9012
3456

EEEE 

7890

и т. д...

И я хочу сопоставить буквенные строки с числовыми строками, чтобы они выглядели так:

AAAA 1234 
BBBB 5678
CCCC 9012
DDDD 3456

EEEE 7890

Кто-нибудь знает простой способ добиться этого?

решение1

В awk, сохраняя пустые строки, предполагая, что файл хорошо отформатирован, но можно добавить логику для проверки файла:

awk -v RS="" '{for(i=1; i<=NF; i++) a[i]=$i
  getline
  for(i=1; i<=NF; i++) print a[i] " " $i
  print ""}' file

решение2

<input sed -nr '/^[A-Z]{4}$/,/^$/w out1
                /^[0-9]{4}$/,/^$/w out2'
paste -d' ' out1 out2 |sed 's/^ $//' 

или, в один шаг, без временных файлов

paste -d' ' <(sed -nr '/^[A-Z]{4}$/,/^$/p' input) \
            <(sed -nr '/^[0-9]{4}$/,/^$/p' input) | sed 's/^ $//' 

Последний sedшаг удаляет разделитель на пустых строках, который вводится paste...

решение3

Один из способов использования perl:

Содержание script.pl:

use warnings;
use strict;

## Check arguments.
die qq[Usage: perl $0 <input-file>\n] unless @ARGV == 1;

my (@alpha, @digit);

while ( <> ) {
        ## Omit blank lines.
        next if m/\A\s*\Z/;

        ## Remove leading and trailing spaces.
        s/\A\s*//;
        s/\s*\Z//;

        ## Save alphanumeric fields and fields with
        ## only digits to different arrays.
        if ( m/\A[[:alpha:]]+\Z/ ) {
                push @alpha, $_;
        }
        elsif ( m/\A[[:digit:]]+\Z/ ) {
                push @digit, $_;
        }
}

## Get same positions from both arrays and print them
## in the same line.
for my $i ( 0 .. $#alpha ) {
        printf qq[%s %s\n], $alpha[ $i ], $digit[ $i ];
}

Содержание infile:

AAAA
BBBB
CCCC
DDDD

1234
5678
9012
3456

EEEE 

7890

Запустите его так:

perl script.pl infile

И результат:

AAAA 1234
BBBB 5678
CCCC 9012
DDDD 3456
EEEE 7890

решение4

Если записи в порядке,

  1. Разделите входные данные на буквенные и числовые, используя grep:

    • grep "[[:alpha:]]\+" < file > alpha
    • grep "[[:digit:]]\+" < file > digit
  2. Объедините два полученных файла alphaи digit, используя paste:

    • paste alpha digit(можно добавить -d " ", чтобы вместо табуляции использовался пробел)

Связанный контент