Как можно отредактировать txt в xls в Unix?

Question

Причина поведения, которое вы видите, заключается в том, что по умолчанию (т.е. пробел, табуляция) awkрассматривается как разделитель поля ввода. Таким образом,WHITESPACEкаждыйэлемент в вашем входном файле, окруженный пробелом, рассматривается как одно "поле" и ему назначается собственная $<number>внутренняя переменная. awkОднако ваша команда предписывает awkпечатать только первые два таких поля ( $1и $2), которые в вашем случае являются строкой даты/времени и литералом tid:.

В вашем конкретном случае самым простым способом может быть использование sedдля заменыпервыйпробелы табулятором, что должно дать желаемый результат.

Поскольку вы также хотите включить строку заголовка, следующее должно сработать (при условии, что sedиспользуется GNU):

sed -e '1 i\DateTime\tError' -e 's/ /\t/' TMP.txt > Output.txt

Первое выражение вставляет одну строку текста в начало строки, второе выполняет предполагаемое «фактическое форматирование».

Обновлять

Для дополнительного формата строки, который вы предоставили, я бы прибегнул к следующему awkвместо sed(обратите внимание, что я использую GNU awk):

awk 'BEGIN{printf("DateTime\tError\n")} {match($0,"^([[:alpha:]]{3}[[:space:]]+[0123]?[[:digit:]],[[:space:]]+20[[:digit:]]{2}[[:space:]]+[01]?[[:digit:]]:[012345][[:digit:]]:[012345][[:digit:]][[:space:]]+[AP]M[[:space:]]+[[:alpha:]]+)[[:space:]]+([[:print:]]*)$", fields); printf("%s\t%s\n", fields[1], fields[2])}' TMP.txt > Output.txt

Это регулярное выражение сопоставляет указанный вами формат времени, за которым следует один или несколько пробелов, за которыми следуют произвольные печатные символы до конца строки, и печатает первую (...)подгруппу, временную метку, затем \t, а затем вторую (...)подгруппу, которая является «остальной частью строки». Кроме того, якорь BEGINиспользуется для вставки строки заголовка сверху.

Поскольку оба случая могут встречаться в одном и том же файле, нам придется объединить их в одну awkпрограмму:

BEGIN {
    printf("DateTime\tError\n");
}

{
if (match($0,"^([[:alpha:]]{3}[[:space:]]+[0123]?[[:digit:]],[[:space:]]+20[[:digit:]]{2}[[:space:]]+[012]?[[:digit:]](:[012345][[:digit:]]){2}[[:space:]]+[AP]M[[:space:]]+[[:upper:]]+)[[:space:]]+([[:print:]]*)$", fields) == 0)
    match($0,"^(20[[:digit:]]{2}-[01][[:digit:]]-[0123][[:digit:]][[:alpha:]][012][[:digit:]](:[012345][[:digit:]]){2}.[[:digit:]]{3}[+-][012][[:digit:]]:[012345][[:digit:]])[[:space:]]+([[:print:]]*)$", fields);

printf("%s\t%s\n", fields[1], fields[3]);
}

Вы можете вызвать приведенный выше скрипт xlsconvert.awk, а затем вызвать его как

user@host$ awk -f xlsconvert.awk TMP.txt > Output.txt

Обратите внимание, что это, конечно, сохранит различные форматы временных меток в выводе. Если вы хотите преобразовать это в унифицированный формат, вам, возможно, придется прибегнуть к скрипту оболочки.

Answer 1