Wie speichere ich Dateiinformationen in einem Array?

Question 1

Erste,tu es nichtfor file in $(find …). Das ist sehr zerbrechlich.

Jetzt können Sie Ihren Code etwas vereinfachen, indem Sie find so veranlassen, die Dateinamen und -größen gemeinsam auszugeben, und zwar mit -printf:

find . -type f -printf '%s.%f/'

Anschließend können Sie awkdiese Ausgabe verarbeiten, um kumulative Größen nach Erweiterung zu erhalten. Beachten Sie, dass ich .den Dateinamen ( %f) von der Größe ( ) getrennt habe und danach %sein hinzugefügt habe . Daher kann ich als Feldtrennzeichen in verwenden . Und da die einzigen in Dateinamen nicht zulässigen Zeichen und das ASCII-NUL sind, kann ich es bedenkenlos als Datensatztrennzeichen verwenden./.awk//

Also:

awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next}
  {size["/"] += $1}
END {for (i in size) {print i,"/",size[i]}'

Hier verwende ich /als Index, wenn keine Erweiterung vorhanden ist.

Kombiniert:

$ find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next}
{size["/"] += $1}
END {for (i in size) {printf "%s/%d\n", i, size[i]}}'
h/780
md/2509
tex/23961
c/13557
//5109
txt/2349291
sh/1166
py/12248

Wenn Ihre Erweiterungen keine Leerzeichen enthalten, können Sie einfach Folgendes tun:

my_array=( $(find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next} {size["/"] += $1} END {for (i in size) {printf "%s/%d\n", i, size[i]}}') )

Oder Sie können die Prozesssubstitution verwenden und jeden Eintrag einlesen in:

my_arr=()
while IFS='' read -r entry
do
    my_arr+=( "$entry" )
done < <(find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next} {size["/"] += $1} END {for (i in size) {printf "%s/%d\n", i, size[i]}}')

Wie vorher:

$ printf "%s\n" "${my_arr[@]}"
h/780
md/2509
tex/23961
c/13557
//5109
txt/2349291
sh/1166
py/12248

Answer