¿Cómo realizar esta sustitución en sed?

¿Cómo realizar esta sustitución en sed?

Tengo este texto:

Table {\label{seq:ref176}} - Table name.




\begin{longtable}{|m{3.36636in}|m{3.36636in}|}

Quiero editarlo así:

\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption{Table name \label{seq:ref176}}\\

Puedo hacer esto de Atomesta manera:

encontrar:Table \{\\label\{(.*?)\}\} - (.*?).\n*\\begin\{longtable\}\{(.*?)\|\}

reemplazar:\begin{longtable}{$3|}\n\\caption {$2 \\label{$1}}\\\\

Intenté hacer esto en sed, pero no funciona. No hay ningún error. Simplemente no puedo encontrar ninguna coincidencia.

s/Table\ \{\\label\{(.*?)\}\}\ \-\ (.*?)\n*\\begin\{longtable\}\{(.*?)\|\}/\\begin\{longtable\}\{\3\|\}\n\\caption\ \{\2\ \\label\{\1\}\}\\\\/g

Respuesta1

Si Perl one-liner es una opción, pruebe con:

perl -0777 -pe 's/Table \{(\\label\{.*?\}\}) - (.*?)\.\s+(\\begin\{longtable\}\{.*?\|\})/$3\n\\caption{$2 $1/' file
\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption{Table name \label{seq:ref176}}

Respuesta2

Su intento tiene un error conceptual y otro menor.

El concepto sedes que elabora archivos línea por línea (por defecto). Afortunadamente, GNU sed puede funcionar en el archivo como un todo si se le pasa el -zparámetro.

La corrección menor es agregar un elemento faltante \.para obtener el resultado deseado. No te culpo porque es muy difícil detectar cosas tan minúsculas cuando la expresión es tan larga y confusa.

Línea de comando:

sed -rz 's/Table\ \{\\label\{(.*?)\}\}\ \-\ (.*?)\.\n*\\begin\{longtable\}\{(.*?)\|\}/\\begin\{longtable\}\{\3\|\}\n\\caption\ \{\2\ \\label\{\1\}\}\\\\/g' file

Producción:

\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption {Table name \label{seq:ref176}}\\

Referenciadel sed GNUdocumentación:

'-z'
'--null-data'
'--zero-terminated'
     Treat the input as a set of lines, each terminated by a zero byte
     (the ASCII 'NUL' character) instead of a newline.  This option can
     be used with commands like 'sort -z' and 'find -print0' to process
     arbitrary file names.

Respuesta3

Preferí escribir un script en pythonlugar de sed, porque es más fácil trabajar con un archivo completo en Python.

#!/usr/bin/python

import re
import argparse


def test_regex(input):
    with open(input) as f:
        data = f.read()

    file = open("output.tex","w") 
    file.write(data)
    file.close() 

    data = re.sub(r'Table \{\\label\{(.*?)\}\} - (.*?).\s*\\begin\{longtable\}\{(.*?)\|\}',
                  r'\\begin{longtable}{\3|}\n\\caption {\2 \\label{\1}}\\\\', data)

    file = open("output.tex","w") 
    file.write(data)
    file.close() 


def main(input):
    test_regex(input)

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument("input")
    args = parser.parse_args()
    input = args.input
    main(input)

información relacionada