![Some o número total de linhas de código em todos os arquivos tar em todos os subdiretórios](https://rvso.com/image/168789/Some%20o%20n%C3%BAmero%20total%20de%20linhas%20de%20c%C3%B3digo%20em%20todos%20os%20arquivos%20tar%20em%20todos%20os%20subdiret%C3%B3rios.png)
Gostaria de calcular a soma do número total de linhas de todos os arquivos tar em todos os subdiretórios.
Considere o seguinte diretório de exemplo se-example
,:
se-example
├── directory1
│ ├── archive1.tar
│ └── archive2.tar
└── directory2
├── README.txt
├── archive3.tar
└── directory3
└── archive4.tar
Para recriar este exemplo, considere o seguinte:
echo "create and enter example"
mkdir se-example
cd se-example
echo "create example directory 1 (w/ two tar files)"
mkdir directory1
cd directory1
echo "create example tar 1 [+7 lines]"
mkdir archive1
printf "Line 1 \n Line 2" >> archive1/README.txt
printf "Line 1 \n Line 2" >> archive1/code1.py
printf "Line 1 \n Line 2 \n Line 3" >> archive1/code2.py
tar -cf archive1.tar archive1
rm -rf archive1
echo "create example tar 2 [+5 lines]"
mkdir archive2
printf "Line 1 \n Line 2 \n Line 3" >> archive2/code1.py
printf "Line 1 \n Line 2" >> archive2/code2.py
tar -cf archive2.tar archive2
rm -rf archive2
cd ..
echo "create example directory 1 (w/ subdirectory, readme, and two tar files)"
mkdir directory2
cd directory2
echo "create example readme [+0 lines]"
printf "Line 1 \n Line 2" >> README.txt
echo "create example tar 3 [+1 line]"
mkdir archive3
printf "Line 1" >> archive3/code1.py
tar -cf archive3.tar archive3
rm -rf archive3
echo "create example subdirectory (w/ one tar file)"
mkdir directory3
cd directory3
echo "create example tar 4 [+5 lines]"
mkdir archive4
printf "Line 1 \n Line 2 \n Line 3" >> archive4/code1.py
printf "Line 1 \n Line 2" >> archive4/code2.py
tar -cf archive4.tar archive4
rm -rf archive4
cd ..
cd ..
cd ..
echo "done creating example"
Neste exemplo, existem quatro arquivos tar com um total de 18 linhas (7 linhas no tar 1, 5 linhas no tar 2, 1 linha no tar 3 e 5 linhas no tar 4). A resposta correta seria 18.
Eu sei contar o número de arquivos tar (sugerido aqui):
find . -maxdepth 1 -mindepth 1 -type d | while read dir; do
printf "%-25.25s : " "$dir"
find "$dir" -name "*.tar" | wc -l
done
Eu sei como contar o número de linhas de código em arquivos tar individuais (sugerido aqui):
tar -tf se-example/directory1/archive1.tar | wc -l
Como faço para combinar esses dois comandos ou existe uma alternativa eficiente que resolva esse problema?
Responder1
Você está perdendo a nova linha \n
da última linha em cada um dos seus arquivos de teste, então a contagem wc
é menor:
$ find . \( -name "*.py" -o -name "README*" \) -print0 | xargs -0 wc -l
1 ./directory1/archive1/README.txt
1 ./directory1/archive1/code1.py
2 ./directory1/archive1/code2.py
2 ./directory1/archive2/code1.py
1 ./directory1/archive2/code2.py
1 ./directory2/README.txt
0 ./directory2/archive3/code1.py
2 ./directory2/directory3/archive4/code1.py
1 ./directory2/directory3/archive4/code2.py
11 total
Como /directory2/README.txt
não está em arquivo, temos 10 linhas no total.
Liste os arquivos nos arquivos:
$ find . -name "*.tar" -print0 | xargs -0I{} tar tf {} archive1/ archive1/README.txt archive1/code1.py archive1/code2.py archive2/ archive2/code1.py archive2/code2.py archive3/ archive3/code1.py archive4/ archive4/code1.py archive4/code2.py
Extraia os arquivos para stdout com a opção
-O
/ :--to-stdout
$ find . -name "*.tar" -print0 | xargs -0I{} tar xOf {} Line 1 Line 2Line 1 Line 2Line 1 Line 2 Line 3Line 1 Line 2 Line 3Line 1 Line 2Line 1Line 1 Line 2 Line 3Line 1 Line 2
(A última linha
Line 2
não tem nova linha)Conte as linhas com
wc
:$ find . -name "*.tar" -print0 | xargs -0I{} tar xOf {} | wc -l 10