Как сохранить информацию о файле в массиве?

Question 1

Первый,не делайfor file in $(find …). Это очень хрупко.

Теперь вы можете немного упростить свой код, заставив find выводить имена файлов и их размеры вместе, используя -printf:

find . -type f -printf '%s.%f/'

Затем вы можете использовать awkдля обработки этого вывода, чтобы получить кумулятивные размеры по расширению. Обратите внимание, что я использовал .для отделения имени файла ( %f) от размера ( %s), и добавил /после этого. Следовательно, я могу использовать .в качестве разделителя полей в awk. И поскольку единственными символами, не разрешенными в именах файлов, являются /и ASCII NUL, я могу безопасно использовать /в качестве разделителя записей.

Так:

awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next}
  {size["/"] += $1}
END {for (i in size) {print i,"/",size[i]}'

Здесь я использую /в качестве индекса, если нет расширения.

В совокупности:

$ find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next}
{size["/"] += $1}
END {for (i in size) {printf "%s/%d\n", i, size[i]}}'
h/780
md/2509
tex/23961
c/13557
//5109
txt/2349291
sh/1166
py/12248

Теперь, если ваши расширения не содержат пробелов, вы можете просто сделать:

my_array=( $(find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next} {size["/"] += $1} END {for (i in size) {printf "%s/%d\n", i, size[i]}}') )

Или вы можете использовать подстановку процесса и прочитать каждую запись в:

my_arr=()
while IFS='' read -r entry
do
    my_arr+=( "$entry" )
done < <(find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next} {size["/"] += $1} END {for (i in size) {printf "%s/%d\n", i, size[i]}}')

Как прежде:

$ printf "%s\n" "${my_arr[@]}"
h/780
md/2509
tex/23961
c/13557
//5109
txt/2349291
sh/1166
py/12248

Answer