
У меня есть такой текст:
Table {\label{seq:ref176}} - Table name.
\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
Я хочу отредактировать это так:
\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption{Table name \label{seq:ref176}}\\
Я могу сделать это Atom
так:
находить:Table \{\\label\{(.*?)\}\} - (.*?).\n*\\begin\{longtable\}\{(.*?)\|\}
заменять:\begin{longtable}{$3|}\n\\caption {$2 \\label{$1}}\\\\
Я пытался сделать это в sed, но это не работает. Ошибки нет. Просто не могу найти совпадений.
s/Table\ \{\\label\{(.*?)\}\}\ \-\ (.*?)\n*\\begin\{longtable\}\{(.*?)\|\}/\\begin\{longtable\}\{\3\|\}\n\\caption\ \{\2\ \\label\{\1\}\}\\\\/g
решение1
Если вам подходит однострочный вариант Perl, попробуйте:
perl -0777 -pe 's/Table \{(\\label\{.*?\}\}) - (.*?)\.\s+(\\begin\{longtable\}\{.*?\|\})/$3\n\\caption{$2 $1/' file
\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption{Table name \label{seq:ref176}}
решение2
В вашей попытке есть одна концептуальная и одна незначительная ошибка.
Концепция заключается sed
в том, что он обрабатывает файлы построчно (по умолчанию). К счастью, GNU sed может работать с файлом целиком, если ему передан параметр -z
.
Небольшое исправление заключается в добавлении пропущенного \.
для получения желаемого результата. Я вас не виню, потому что очень трудно заметить такие мелкие вещи, когда выражение такое длинное и запутанное.
Командная строка:
sed -rz 's/Table\ \{\\label\{(.*?)\}\}\ \-\ (.*?)\.\n*\\begin\{longtable\}\{(.*?)\|\}/\\begin\{longtable\}\{\3\|\}\n\\caption\ \{\2\ \\label\{\1\}\}\\\\/g' file
Выход:
\begin{longtable}{|m{3.36636in}|m{3.36636in}|}
\caption {Table name \label{seq:ref176}}\\
Ссылкаиз GNU sedдокументация:
'-z'
'--null-data'
'--zero-terminated'
Treat the input as a set of lines, each terminated by a zero byte
(the ASCII 'NUL' character) instead of a newline. This option can
be used with commands like 'sort -z' and 'find -print0' to process
arbitrary file names.
решение3
Я предпочел написать скрипт на Python , python
а не на sed
Python, потому что на Python проще работать со всем файлом.
#!/usr/bin/python
import re
import argparse
def test_regex(input):
with open(input) as f:
data = f.read()
file = open("output.tex","w")
file.write(data)
file.close()
data = re.sub(r'Table \{\\label\{(.*?)\}\} - (.*?).\s*\\begin\{longtable\}\{(.*?)\|\}',
r'\\begin{longtable}{\3|}\n\\caption {\2 \\label{\1}}\\\\', data)
file = open("output.tex","w")
file.write(data)
file.close()
def main(input):
test_regex(input)
if __name__ == '__main__':
parser = argparse.ArgumentParser()
parser.add_argument("input")
args = parser.parse_args()
input = args.input
main(input)