allpackages.txt.gz hat zwei unterschiedliche Dateigrößen?

allpackages.txt.gz hat zwei unterschiedliche Dateigrößen?

ich sahhttp://linux.koolsolutions.com/2008/12/19/counting-number-of-packages-under-debian-linux/und ich wollte die Anzahl der getesteten Pakete zählen.

Ich habe es wie darin beschrieben versucht: -

http://packages.debian.org/testing/allpackages?format=txt.gz
Resolving packages.debian.org (packages.debian.org)... 5.153.231.3, 2001:41c8:1000:21::21:3, 2001:8d8:880:901::1a1:4
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://packages.debian.org/testing/allpackages?format=txt.gz [following]
--2014-10-08 01:52:54--  https://packages.debian.org/testing/allpackages?format=txt.gz
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1039782 (1015K) [text/plain]
Saving to: ‘allpackages?format=txt.gz’

100%[======================================================================================================>] 10,39,782   64.0KB/s   in 13s    

$ mv allpackages\?format=txt.gz allpackages.txt.gz

$ gunzip allpackages.txt.gz

$ ll -h allpackages.txt 
-rw-r--r-- 1 shirish shirish 4.9M Oct  7 23:53 allpackages.txt

Wenn ich jedoch versuche, alle Pakete abzurufen, ohne sie zu komprimieren, erhalte ich Folgendes: -

$ wget http://packages.debian.org/testing/allpackages
--2014-10-08 01:52:11--  http://packages.debian.org/testing/allpackages
Resolving packages.debian.org (packages.debian.org)... 5.153.231.3, 2001:41c8:1000:21::21:3, 2001:8d8:880:901::1a1:4
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://packages.debian.org/testing/allpackages [following]
--2014-10-08 01:52:11--  https://packages.debian.org/testing/allpackages
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 10110498 (9.6M) [text/html]
Saving to: ‘allpackages’

 9% [========>                                                                                              ] 9,49,116    55.5KB/s  eta 1m 48s 
Terminated

Irgendeine Idee, warum zwischen diesen beiden Zählungen ein Unterschied von mehr als 100 % in der Bytegröße besteht? Einmal 4,9 MB und einmal 9,6 MB?

Edit: Folgefrage beiSo finden Sie die Anzahl eindeutiger „Anwendungen“ in Debian Jessie

Antwort1

Beachten Sie, dass [text/html]für den zweiten Eintrag nicht steht [text/plain]. Sie holen nicht die Paketliste, sondern eine Webseite, dieenthältdie Paketliste, zusammen mit einer Reihe anderer Formatierungen.

Aber eigentlich möchten Sie die komprimierte Version abrufen. Das spart sowohl Ihnen als auch Debian Zeit und Geld. Sie können dies mit einem Befehl tun:

wget 'http://packages.debian.org/testing/allpackages?format=txt.gz' -O - | gunzip > allpackages.txt

Oder zählen Sie die Zeilen direkt (beachten Sie jedoch, dass dies aufgrund zusätzlicher Zeilen am Anfang der Datei leicht abweichen kann):

wget 'http://packages.debian.org/testing/allpackages?format=txt.gz' -O - | gunzip | wc -l

verwandte Informationen