csplit no reconoce la expresión regular proporcionada

Question 1

Csplit es una utilidad de texto. Está basado en líneas. Un patrón /FORM/significa "una línea que contiene FORM". Una línea es una secuencia de bytes distintos de LF (avance de línea, también conocido como nueva línea, que puede escribirse \n, ^J,…), seguido de un byte LF (o del final del archivo, con utilidades GNU). Por lo tanto, la "basura" que observa es lo que hay entre el carácter LF anterior y la FORMsubcadena.

La página de manual y la --helpbreve descripción asumen que ya sabes lo que hace el comando, por lo que solo mencionan "piezas" sin explicación. Necesitas leer eldocumentación completapara obtener una descripción de cuáles son las piezas.

No puedes hacer lo que quieras con csplit. Puedes hacerlo con GNU awk. (Es posible que otras versiones de awk no tengan las características requeridas: soporte de separadores de registros arbitrarios y manejo de bytes nulos). No probado:

gawk -v RS='FORM' -v ORS='' '{
    print "FORM" $0 >sprintf("sample-%04d.aif", n++)
}' DATA.DAT

Pero esto puede afectar a lugares falsos si los datos comprimidos contienen los cuatro bytes FORM. Esto puede ser lo suficientemente bueno para una operación única con revisión manual, pero sería mejor que tuviera una herramienta compatible con el formato si necesita algo confiable.

Answer

Csplit es una utilidad de texto. Está basado en líneas. Un patrón /FORM/significa "una línea que contiene FORM". Una línea es una secuencia de bytes distintos de LF (avance de línea, también conocido como nueva línea, que puede escribirse \n, ^J,…), seguido de un byte LF (o del final del archivo, con utilidades GNU). Por lo tanto, la "basura" que observa es lo que hay entre el carácter LF anterior y la FORMsubcadena.

La página de manual y la --helpbreve descripción asumen que ya sabes lo que hace el comando, por lo que solo mencionan "piezas" sin explicación. Necesitas leer eldocumentación completapara obtener una descripción de cuáles son las piezas.

No puedes hacer lo que quieras con csplit. Puedes hacerlo con GNU awk. (Es posible que otras versiones de awk no tengan las características requeridas: soporte de separadores de registros arbitrarios y manejo de bytes nulos). No probado:

gawk -v RS='FORM' -v ORS='' '{
    print "FORM" $0 >sprintf("sample-%04d.aif", n++)
}' DATA.DAT

Pero esto puede afectar a lugares falsos si los datos comprimidos contienen los cuatro bytes FORM. Esto puede ser lo suficientemente bueno para una operación única con revisión manual, pero sería mejor que tuviera una herramienta compatible con el formato si necesita algo confiable.

Question 2

Una utilidad basada en texto no es apropiada para manipular archivos binarios.

Es probable que obtenga mejores resultados conLib/aifc,PySoundFile, o elffmpegaplicación de línea de comando.

Answer

Una utilidad basada en texto no es apropiada para manipular archivos binarios.

Es probable que obtenga mejores resultados conLib/aifc,PySoundFile, o elffmpegaplicación de línea de comando.

csplit no reconoce la expresión regular proporcionada

Respuesta1

Respuesta2

información relacionada