У меня есть файл с двумя строками:
XXXXXXX20170412,bu.1519=1,bu.1124=2,bu.1284=3,bu.1767=13,bu.1869=15,bu.1784=16,bu.1473=32,bu.1264=43,bu.1758=96,bu.1649=122,bu.1345=140,bu.1268=215,bu.1246=516,bu.1876=601,
XXXXXXX20170413,bu.1123=1,bu.1767=27,bu.1784=32,bu.1473=57,bu.1869=41,bu.1264=91,bu.1284=54,bu.1758=191,bu.1268=387,bu.1345=319,bu.1649=322,bu.1246=1199,bu.1876=1383,
Я хочу получить все строки, существующие в первой строке (начиная со строки между ", и=") и не существующие в последней строке, и добавить их в конец последней строки.
решение1
Формируем хэш %h
, ключами которого являются строки между ,
и =
. Это формируется только для первой строки. Затем на второй строке мы ищем, присутствуют ли эти ключи во 2-й строке, и собираем те, которые не найдены, и join
объединяем их запятой.
perl -F, -lpe '
$. == 1 and %h = /,([^=]*)=([^,]*)/g, next;
$l = $_;
$_ .= join ",", grep $l !~ /,\Q$_=/, keys %h;
' your_2-line_file
Результат
XXXXXXX20170412,bu.1519=1,bu.1124=2,bu.1284=3,bu.1767=13,bu.1869=15,bu.1784=16,bu.1473=32,bu.1264=43,bu.1758=96,bu.1649=122,bu.1345=140,bu.1268=215,bu.1246=516,bu.1876=601,
XXXXXXX20170413,bu.1123=1,bu.1767=27,bu.1784=32,bu.1473=57,bu.1869=41,bu.1264=91,bu.1284=54,bu.1758=191,bu.1268=387,bu.1345=319,bu.1649=322,bu.1246=1199,bu.1876=1383,bu.1519,bu.1124
решение2
Я бы разделил файл на два, каждый из которых содержал бы одну из строк. Затем я бы разделил строки по запятой. Затем запустил бы diff и скопировал результаты, объединил бы их обратно в одну строку,и виола.
Это долгий путь вокруг. Я уверен, что вы могли бы написать какой-то awk
сценарий или что-то в этом роде, чтобы сделать это одним махом.