テキストファイルから特定の構造を持つ新しいファイルを生成する

Question 1

ここに単純な ksh があります:

{
  read t1 t2 t3 t4
  maxlen=$(printf "%s\n" ${#t1} ${#t2} ${#t3} ${#t4} | sort -n | tail -1)
  fmt=$(printf "%%-%ds -> %%s" $maxlen)
  read line
  while read date time tel id type; do
    printf "$fmt\n" $t1 "$date $time" $t2 $tel $t3 $id $t4 $type
    print "\n\n\n---\n\n"
  done
} < orig-file.txt

アップデートフィールドの数は柔軟に設定可能:

解析しやすくするために、datetimeフィールドのスペースを置き換えます

sed '3,$s/ /@@/' orig-file.txt | 
{
    read line
    set -A headings $line
    max=0
    for head in "${headings[@]}"; do (( max < ${#head} )) && max=${#head}; done
    fmt=$(printf "%%-%ds -> %%s" $max)

    read line

    while read line; do
        set -A fields $line
        i=0
        while (( i < ${#headings[@]} )); do
            printf "$fmt\n" ${headings[$i]} ${fields[$i]} | sed 's/@@/ /'
            (( i=i+1 ))
        done
        print "\n\n\n---\n\n"
    done
}

Answer

ここに単純な ksh があります:

{
  read t1 t2 t3 t4
  maxlen=$(printf "%s\n" ${#t1} ${#t2} ${#t3} ${#t4} | sort -n | tail -1)
  fmt=$(printf "%%-%ds -> %%s" $maxlen)
  read line
  while read date time tel id type; do
    printf "$fmt\n" $t1 "$date $time" $t2 $tel $t3 $id $t4 $type
    print "\n\n\n---\n\n"
  done
} < orig-file.txt

アップデートフィールドの数は柔軟に設定可能:

解析しやすくするために、datetimeフィールドのスペースを置き換えます

sed '3,$s/ /@@/' orig-file.txt | 
{
    read line
    set -A headings $line
    max=0
    for head in "${headings[@]}"; do (( max < ${#head} )) && max=${#head}; done
    fmt=$(printf "%%-%ds -> %%s" $max)

    read line

    while read line; do
        set -A fields $line
        i=0
        while (( i < ${#headings[@]} )); do
            printf "$fmt\n" ${headings[$i]} ${fields[$i]} | sed 's/@@/ /'
            (( i=i+1 ))
        done
        print "\n\n\n---\n\n"
    done
}

Question 2

この場合はこれで十分です。さらにフィールドを追加する場合は、ちょっとした変更が必要です。

awk 'NR>2{
    printf "\
%-16s -> %s\n\
%-16s -> %s\n\
%-16s -> %s\n\
%-16s -> %s\
\n\n\n---\n\n\n",\
        "CREATE_TIMESTAMP", $1" "$2,\
        "TELEPHONE_NUMBER", $3,\
        "ID", $4,\
        "TYPE", $5}\
' orig-file.txt > output-file.txt

「CREATE_TIMESTAMP」では、日付自体は空白で区切られているため、と$1の両方が必要です。$2

ヘッダーからフィールド名を読み取るように変更することはできますが、日付が空白で区切られているという問題があります。他のフィールドにも空白を含めることができる場合は、この$1" "$2場合のように、常に手動で修正して補正する必要があります。

Answer

この場合はこれで十分です。さらにフィールドを追加する場合は、ちょっとした変更が必要です。

awk 'NR>2{
    printf "\
%-16s -> %s\n\
%-16s -> %s\n\
%-16s -> %s\n\
%-16s -> %s\
\n\n\n---\n\n\n",\
        "CREATE_TIMESTAMP", $1" "$2,\
        "TELEPHONE_NUMBER", $3,\
        "ID", $4,\
        "TYPE", $5}\
' orig-file.txt > output-file.txt

「CREATE_TIMESTAMP」では、日付自体は空白で区切られているため、と$1の両方が必要です。$2

ヘッダーからフィールド名を読み取るように変更することはできますが、日付が空白で区切られているという問題があります。他のフィールドにも空白を含めることができる場合は、この$1" "$2場合のように、常に手動で修正して補正する必要があります。

テキストファイルから特定の構造を持つ新しいファイルを生成する

元のファイル.txt

出力ファイル.txt

答え1

答え2

関連情報