So gruppieren Sie Zeichenfolgen gleicher Länge mit awk neu

So gruppieren Sie Zeichenfolgen gleicher Länge mit awk neu

Ich habe eine lange Liste mit Zeichenfolgen wie diese:

_ah_
_asn_
_ai_
_errr_
_an_

Und ich möchte es so umwandeln

"_ah_ai_an_",
"_asn_",
"_errr_"

Ich habe versucht :

cat file | awk '{ print length, $0 }' | sort -n -s | cut -d" " -f2-

Das sortiert es im Wesentlichen nach Länge, aber was ich versuche, ist, diejenigen mit der gleichen Länge in der gleichen Zeile mit ","As-Trennzeichen zu haben

Antwort1

$ cat tst.awk
{
    lgth = length($0)
    sub(/_$/,"",strs[lgth])
    strs[lgth] = strs[lgth] $0
}
END {
    for (lgth in strs) {
        printf "%s\"%s\"", sep, strs[lgth]
        sep = "," ORS
    }
    print ""
}

$ awk -f tst.awk file
"_ah_ai_an_",
"_asn_",
"_errr_"

Antwort2

Dies ergibt die gewünschte Ausgabe:

awk -F_ '
    {strr[length] = strr[length]"_"$2}
    length > max {max=length}
    END {
        for (i=1;i<max;i++) {if (strr[i]) print "\"" strr[i]"_\","}
        print "\"" strr[max]"_\""
    }' file

Zeilen mit der Länge werden mit einem führenden iangehängt . Am Ende durchlaufen wir einfach die vorhandenen Elemente und geben sie mit aus , mit Ausnahme des letzten Elements, das kein erhält .strr[i]_strr"<element>_",,

verwandte Informationen