ファイル情報を配列に保存するにはどうすればいいですか?

Question 1

初め、しないでくださいfor file in $(find …)それはとても壊れやすいです。

ここで、次のようにして、find でファイル名とサイズを一緒に印刷することで、コードを少し簡略化できます-printf。

find . -type f -printf '%s.%f/'

次に、を使用しawkてこの出力を処理し、拡張子ごとの累積サイズを取得できます。.ファイル名 ( %f) とサイズ ( %s) を区切るためにを使用し、その後にを追加したことに注意してください。したがって、でフィールド区切り文字として/を使用できます。また、ファイル名で許可されていない文字はと ASCII NUL のみであるため、をレコード区切り文字として安全に使用できます。.awk//

それで：

awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next}
  {size["/"] += $1}
END {for (i in size) {print i,"/",size[i]}'

/ここでは、拡張子がない場合にインデックスとして使用しています。

組み合わせ:

$ find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next}
{size["/"] += $1}
END {for (i in size) {printf "%s/%d\n", i, size[i]}}'
h/780
md/2509
tex/23961
c/13557
//5109
txt/2349291
sh/1166
py/12248

拡張子にスペースが含まれていない場合は、次のようにします。

my_array=( $(find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next} {size["/"] += $1} END {for (i in size) {printf "%s/%d\n", i, size[i]}}') )

または、プロセス置換を使用して、次の各エントリを読み取ることもできます。

my_arr=()
while IFS='' read -r entry
do
    my_arr+=( "$entry" )
done < <(find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next} {size["/"] += $1} END {for (i in size) {printf "%s/%d\n", i, size[i]}}')

従来通り：

$ printf "%s\n" "${my_arr[@]}"
h/780
md/2509
tex/23961
c/13557
//5109
txt/2349291
sh/1166
py/12248

Answer