¿Cómo puedo editar txt a xls en Unix?

Question

El motivo del comportamiento que ve es que, de forma predeterminada, awktrata WHITESPACE(es decir, espacio, tabulación) como separador de campo de entrada. De este modo,cadaEl elemento en su archivo de entrada que está rodeado por un espacio se trata como un "campo" único y se le asigna su propia $<number>variable interna. Su awkcomando, sin embargo, indica awkimprimir solo los dos primeros campos ( $1y $2), que en su caso son la cadena de fecha/hora y el literal tid:.

En su caso particular, la forma más sencilla podría ser utilizar sedpara reemplazar elprimeroespacios en blanco mediante un tabulador, que debería dar el resultado deseado.

Como también desea incluir una línea de encabezado, lo siguiente debería funcionar (suponiendo que sedse esté utilizando GNU):

sed -e '1 i\DateTime\tError' -e 's/ /\t/' TMP.txt > Output.txt

La primera expresión inserta una línea de texto al principio de la línea, la segunda realiza el "formato real" previsto.

Actualizar

Para el formato de cadena adicional que proporcionó, recurriría a awken lugar de sed(tenga en cuenta que uso GNU awk):

awk 'BEGIN{printf("DateTime\tError\n")} {match($0,"^([[:alpha:]]{3}[[:space:]]+[0123]?[[:digit:]],[[:space:]]+20[[:digit:]]{2}[[:space:]]+[01]?[[:digit:]]:[012345][[:digit:]]:[012345][[:digit:]][[:space:]]+[AP]M[[:space:]]+[[:alpha:]]+)[[:space:]]+([[:print:]]*)$", fields); printf("%s\t%s\n", fields[1], fields[2])}' TMP.txt > Output.txt

Esta expresión regular coincide con un formato de hora especificado por usted, seguido de uno o más espacios, seguido de caracteres imprimibles arbitrarios hasta el final de la línea, e imprime el primer (...)subgrupo, la marca de tiempo, luego a \ty luego el segundo. (...)subgrupo, que es "el resto de la línea". Además, el BEGINancla se utiliza para insertar la línea del encabezado en la parte superior.

Como ambos casos pueden darse en un mismo archivo, tenemos que combinarlos en un solo awkprograma:

BEGIN {
    printf("DateTime\tError\n");
}

{
if (match($0,"^([[:alpha:]]{3}[[:space:]]+[0123]?[[:digit:]],[[:space:]]+20[[:digit:]]{2}[[:space:]]+[012]?[[:digit:]](:[012345][[:digit:]]){2}[[:space:]]+[AP]M[[:space:]]+[[:upper:]]+)[[:space:]]+([[:print:]]*)$", fields) == 0)
    match($0,"^(20[[:digit:]]{2}-[01][[:digit:]]-[0123][[:digit:]][[:alpha:]][012][[:digit:]](:[012345][[:digit:]]){2}.[[:digit:]]{3}[+-][012][[:digit:]]:[012345][[:digit:]])[[:space:]]+([[:print:]]*)$", fields);

printf("%s\t%s\n", fields[1], fields[3]);
}

Puede llamar al script anterior xlsconvert.awky luego llamarlo como

user@host$ awk -f xlsconvert.awk TMP.txt > Output.txt

Tenga en cuenta que esto, por supuesto, mantendrá los diferentes formatos de marca de tiempo en la salida. Si desea convertirlo a un formato unificado, es posible que deba recurrir a un script de shell.

Answer 1