Ajuda com formatação de texto

Ajuda com formatação de texto

Preciso de ajuda com scripts bash. Abaixo está minha opinião:

Grp: MG1
user1 
user2 
user3 
Grp: MG2
user7 
user1 
user9 
user6 
user2 

O resultado deve ser parecido com:

Reporting MG1
MG1,user1 
MG1,user2 
MG1,user3 
Reporting MG2
MG2,user7 
MG2,user1 
MG2,user9 
MG2,user6 
MG2,user2 

Eu tentei sed -n '/cn:/,/cn:/p' file, mas não fez o que eu queria.

Responder1

com awkqual é a ferramenta certa para formatação de texto:

awk '/^Grp:/ { OFS=" "; $1= "Reporting"; mg=$2; print; next} 
             { OFS=","; print mg, $0}' infile

Responder2

Usando sed:

$ cat script.sed
/^Grp: / {                              ;# A "Grp: " line
        s///                            ;# Remove "Grp: "
        h                               ;# Save in hold space
        s/^/Reporting /p                ;# Insert "Reporting " at start, print
        d                               ;# Delete, start next cycle
}

# Any other line:
G                               ;# Append the hold space
s/\(.*\)\n\(.*\)/\2,\1/         ;# Swap strings around \n, insert comma
$ sed -f script.sed file
Reporting MG1
MG1,user1
MG1,user2
MG1,user3
Reporting MG2
MG2,user7
MG2,user1
MG2,user9
MG2,user6
MG2,user2

Como uma "linha única":

sed -e '/^Grp: /{s///;h;s/^/Reporting /p;d;}' \
    -e 'G;s/\(.*\)\n\(.*\)/\2,\1/' file

Uma abordagem semelhante à acima com awk:

awk '/^Grp: / { sub("^Grp: ", ""); group = $0; print "Reporting " $0; next }
              { print group "," $0 }' file

Ambas as variações sede awknesta resposta (bem como a shvariante no final abaixo) lidariam com espaços nos dados, nas MGstrings ou nas userstrings:

$ cat file
Grp: some group ID
line 1
the other line
$ sed -e '/^Grp: /{s///;h;s/^/Reporting /p;d;}' -e 'G;s/\(.*\)\n\(.*\)/\2,\1/' file
Reporting some group ID
some group ID,line 1
some group ID,the other line

Apenas como um exercício divertido, usando /bin/sh:

while IFS= read -r line; do
        case $line in
                'Grp: '*)
                        group=${line#Grp: }
                        printf 'Reporting %s\n' "$group"
                        ;;
                *)
                        printf '%s,%s\n' "$group" "$line"
        esac
done

Correr com

sh script.sh <file

Responder3

Dada a sua amostra de entrada acima, você pode usar isto:

#!/bin/bash

group=""

while read line; do
    if [[ "${line}" =~ ^Grp:* ]]; then
        group="$(echo "${line}" | awk '{ print $2 }')"
        echo "Reporting ${group}"
    elif [[ "${line}" == "" ]]; then
        echo
    else
        echo "${group},${line}"
    fi
done

Por exemplo:

$ cat input
Grp: MG1
user1
user2
user3
Grp: MG2
user7
user1
user9
user6
user2
$

$ ./ex.sh < input
Reporting MG1
MG1,user1
MG1,user2
MG1,user3
Reporting MG2
MG2,user7
MG2,user1
MG2,user9
MG2,user6
MG2,user2
$

O script executa um loop que lê uma linha de texto. Se a linha começar com Grp:, ela salvará o segundo token delimitado por espaço em branco como group. Se a linha estiver em branco, será impressa uma linha em branco. Caso contrário, imprime o último grupo lido, seguido de uma vírgula, seguido do conteúdo da linha.

informação relacionada