Как выполнить эту замену в sed?

Как выполнить эту замену в sed?

У меня есть такой текст:

Table {\label{seq:ref176}} - Table name.




\begin{longtable}{|m{3.36636in}|m{3.36636in}|}

Я хочу отредактировать это так:

\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption{Table name \label{seq:ref176}}\\

Я могу сделать это Atomтак:

находить:Table \{\\label\{(.*?)\}\} - (.*?).\n*\\begin\{longtable\}\{(.*?)\|\}

заменять:\begin{longtable}{$3|}\n\\caption {$2 \\label{$1}}\\\\

Я пытался сделать это в sed, но это не работает. Ошибки нет. Просто не могу найти совпадений.

s/Table\ \{\\label\{(.*?)\}\}\ \-\ (.*?)\n*\\begin\{longtable\}\{(.*?)\|\}/\\begin\{longtable\}\{\3\|\}\n\\caption\ \{\2\ \\label\{\1\}\}\\\\/g

решение1

Если вам подходит однострочный вариант Perl, попробуйте:

perl -0777 -pe 's/Table \{(\\label\{.*?\}\}) - (.*?)\.\s+(\\begin\{longtable\}\{.*?\|\})/$3\n\\caption{$2 $1/' file
\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption{Table name \label{seq:ref176}}

решение2

В вашей попытке есть одна концептуальная и одна незначительная ошибка.

Концепция заключается sedв том, что он обрабатывает файлы построчно (по умолчанию). К счастью, GNU sed может работать с файлом целиком, если ему передан параметр -z.

Небольшое исправление заключается в добавлении пропущенного \.для получения желаемого результата. Я вас не виню, потому что очень трудно заметить такие мелкие вещи, когда выражение такое длинное и запутанное.

Командная строка:

sed -rz 's/Table\ \{\\label\{(.*?)\}\}\ \-\ (.*?)\.\n*\\begin\{longtable\}\{(.*?)\|\}/\\begin\{longtable\}\{\3\|\}\n\\caption\ \{\2\ \\label\{\1\}\}\\\\/g' file

Выход:

\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption {Table name \label{seq:ref176}}\\

Ссылкаиз GNU sedдокументация:

'-z'
'--null-data'
'--zero-terminated'
     Treat the input as a set of lines, each terminated by a zero byte
     (the ASCII 'NUL' character) instead of a newline.  This option can
     be used with commands like 'sort -z' and 'find -print0' to process
     arbitrary file names.

решение3

Я предпочел написать скрипт на Python , pythonа не на sedPython, потому что на Python проще работать со всем файлом.

#!/usr/bin/python

import re
import argparse


def test_regex(input):
    with open(input) as f:
        data = f.read()

    file = open("output.tex","w") 
    file.write(data)
    file.close() 

    data = re.sub(r'Table \{\\label\{(.*?)\}\} - (.*?).\s*\\begin\{longtable\}\{(.*?)\|\}',
                  r'\\begin{longtable}{\3|}\n\\caption {\2 \\label{\1}}\\\\', data)

    file = open("output.tex","w") 
    file.write(data)
    file.close() 


def main(input):
    test_regex(input)

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument("input")
    args = parser.parse_args()
    input = args.input
    main(input)

Связанный контент