csplit не распознает предоставленное регулярное выражение

Question 1

Csplit — это текстовая утилита. Она основана на строках. Шаблон /FORM/означает «строка, содержащая FORM». Строка — это последовательность байтов, отличных от LF (перевод строки, также известный как новая строка, который может быть записан \n, ^J, …), за которой следует байт LF (или конец файла с помощью утилит GNU). Таким образом, «мусор», который вы видите, — это то, что находится между предыдущим символом LF и FORMподстрокой.

Страница руководства и --helpкраткое описание предполагают, что вы уже знаете, что делает команда, поэтому они просто упоминают «части» без объяснений. Вам нужно прочитатьполная документациячтобы получить описание того, что представляют собой эти части.

Вы не можете делать то, что хотите, с csplit. Вы можете сделать это с GNU awk. (Другие версии awk могут не иметь необходимых функций — поддержки произвольных разделителей записей и обработки нулевых байтов.) Непроверено:

gawk -v RS='FORM' -v ORS='' '{
    print "FORM" $0 >sprintf("sample-%04d.aif", n++)
}' DATA.DAT

Но это может привести к сбою в ложных местах, если сжатые данные просто содержат четыре байта FORM. Этого может быть достаточно для одноразовой операции с ручным просмотром, но вам лучше использовать инструмент с поддержкой формата, если вам нужно что-то надежное.

Answer

Csplit — это текстовая утилита. Она основана на строках. Шаблон /FORM/означает «строка, содержащая FORM». Строка — это последовательность байтов, отличных от LF (перевод строки, также известный как новая строка, который может быть записан \n, ^J, …), за которой следует байт LF (или конец файла с помощью утилит GNU). Таким образом, «мусор», который вы видите, — это то, что находится между предыдущим символом LF и FORMподстрокой.

Страница руководства и --helpкраткое описание предполагают, что вы уже знаете, что делает команда, поэтому они просто упоминают «части» без объяснений. Вам нужно прочитатьполная документациячтобы получить описание того, что представляют собой эти части.

Вы не можете делать то, что хотите, с csplit. Вы можете сделать это с GNU awk. (Другие версии awk могут не иметь необходимых функций — поддержки произвольных разделителей записей и обработки нулевых байтов.) Непроверено:

gawk -v RS='FORM' -v ORS='' '{
    print "FORM" $0 >sprintf("sample-%04d.aif", n++)
}' DATA.DAT

Но это может привести к сбою в ложных местах, если сжатые данные просто содержат четыре байта FORM. Этого может быть достаточно для одноразовой операции с ручным просмотром, но вам лучше использовать инструмент с поддержкой формата, если вам нужно что-то надежное.

Question 2

Текстовая утилита не подходит для работы с двоичными файлами.

Вы, вероятно, получите лучшие результаты сLib/aifc,PySoundFile, илиffmpegприложение командной строки.

Answer

Текстовая утилита не подходит для работы с двоичными файлами.

Вы, вероятно, получите лучшие результаты сLib/aifc,PySoundFile, илиffmpegприложение командной строки.

csplit не распознает предоставленное регулярное выражение

решение1

решение2

Связанный контент