Como realizar essa substituição no sed?

Como realizar essa substituição no sed?

Eu tenho este texto:

Table {\label{seq:ref176}} - Table name.




\begin{longtable}{|m{3.36636in}|m{3.36636in}|}

Quero editá-lo assim:

\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption{Table name \label{seq:ref176}}\\

Eu posso fazer isso Atomassim:

encontrar:Table \{\\label\{(.*?)\}\} - (.*?).\n*\\begin\{longtable\}\{(.*?)\|\}

substituir:\begin{longtable}{$3|}\n\\caption {$2 \\label{$1}}\\\\

Tentei fazer isso no sed, mas não funciona. Não há erro. Só não consigo encontrar nenhuma correspondência.

s/Table\ \{\\label\{(.*?)\}\}\ \-\ (.*?)\n*\\begin\{longtable\}\{(.*?)\|\}/\\begin\{longtable\}\{\3\|\}\n\\caption\ \{\2\ \\label\{\1\}\}\\\\/g

Responder1

Se Perl one-liner for uma opção, tente:

perl -0777 -pe 's/Table \{(\\label\{.*?\}\}) - (.*?)\.\s+(\\begin\{longtable\}\{.*?\|\})/$3\n\\caption{$2 $1/' file
\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption{Table name \label{seq:ref176}}

Responder2

Sua tentativa tem um erro conceitual e um erro menor.

O conceito sedé que ele elabore arquivos linha por linha (por padrão). Felizmente, o GNU sed pode funcionar no arquivo como um todo se o -zparâmetro for passado.

A pequena correção é adicionar uma falta \.para obter a saída desejada. Não te culpo porque é muito difícil identificar coisas tão minúsculas quando a expressão é tão longa e confusa.

Linha de comando:

sed -rz 's/Table\ \{\\label\{(.*?)\}\}\ \-\ (.*?)\.\n*\\begin\{longtable\}\{(.*?)\|\}/\\begin\{longtable\}\{\3\|\}\n\\caption\ \{\2\ \\label\{\1\}\}\\\\/g' file

Saída:

\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption {Table name \label{seq:ref176}}\\

Referênciado GNU seddocumentação:

'-z'
'--null-data'
'--zero-terminated'
     Treat the input as a set of lines, each terminated by a zero byte
     (the ASCII 'NUL' character) instead of a newline.  This option can
     be used with commands like 'sort -z' and 'find -print0' to process
     arbitrary file names.

Responder3

Preferi escrever script em pythonvez de sedporque é mais fácil trabalhar com arquivo inteiro em python.

#!/usr/bin/python

import re
import argparse


def test_regex(input):
    with open(input) as f:
        data = f.read()

    file = open("output.tex","w") 
    file.write(data)
    file.close() 

    data = re.sub(r'Table \{\\label\{(.*?)\}\} - (.*?).\s*\\begin\{longtable\}\{(.*?)\|\}',
                  r'\\begin{longtable}{\3|}\n\\caption {\2 \\label{\1}}\\\\', data)

    file = open("output.tex","w") 
    file.write(data)
    file.close() 


def main(input):
    test_regex(input)

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument("input")
    args = parser.parse_args()
    input = args.input
    main(input)

informação relacionada