Cómo reagrupar cadenas con la misma longitud usando awk

Cómo reagrupar cadenas con la misma longitud usando awk

Tengo una larga lista de cadenas como esta:

_ah_
_asn_
_ai_
_errr_
_an_

Y me gustaría transformarlo así.

"_ah_ai_an_",
"_asn_",
"_errr_"

Yo he tratado :

cat file | awk '{ print length, $0 }' | sort -n -s | cut -d" " -f2-

Básicamente, lo ordeno por longitud, pero lo que estoy tratando de hacer es tener aquellos de la misma longitud en la misma línea con ","delimitadores As.

Respuesta1

$ cat tst.awk
{
    lgth = length($0)
    sub(/_$/,"",strs[lgth])
    strs[lgth] = strs[lgth] $0
}
END {
    for (lgth in strs) {
        printf "%s\"%s\"", sep, strs[lgth]
        sep = "," ORS
    }
    print ""
}

$ awk -f tst.awk file
"_ah_ai_an_",
"_asn_",
"_errr_"

Respuesta2

Esto le da el resultado que desea:

awk -F_ '
    {strr[length] = strr[length]"_"$2}
    length > max {max=length}
    END {
        for (i=1;i<max;i++) {if (strr[i]) print "\"" strr[i]"_\","}
        print "\"" strr[max]"_\""
    }' file

Las líneas con longitud ise añaden strr[i]con un interlineado _. Al final, simplemente recorremos strrlos elementos existentes y los generamos con "<element>_",, excepto el último elemento, que no obtiene ,.

información relacionada