allpackages.txt.gz には 2 つの異なるファイル サイズがありますか?

allpackages.txt.gz には 2 つの異なるファイル サイズがありますか?

私が見たhttp://linux.koolsolutions.com/2008/12/19/counting-number-of-packages-under-debian-linux/テスト中のパッケージの数を数えたいと思いました。

そこに共有されているように試してみました:-

http://packages.debian.org/testing/allpackages?format=txt.gz
Resolving packages.debian.org (packages.debian.org)... 5.153.231.3, 2001:41c8:1000:21::21:3, 2001:8d8:880:901::1a1:4
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://packages.debian.org/testing/allpackages?format=txt.gz [following]
--2014-10-08 01:52:54--  https://packages.debian.org/testing/allpackages?format=txt.gz
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1039782 (1015K) [text/plain]
Saving to: ‘allpackages?format=txt.gz’

100%[======================================================================================================>] 10,39,782   64.0KB/s   in 13s    

$ mv allpackages\?format=txt.gz allpackages.txt.gz

$ gunzip allpackages.txt.gz

$ ll -h allpackages.txt 
-rw-r--r-- 1 shirish shirish 4.9M Oct  7 23:53 allpackages.txt

ただし、圧縮せずにすべてのパッケージを取得しようとすると、次のようになります:-

$ wget http://packages.debian.org/testing/allpackages
--2014-10-08 01:52:11--  http://packages.debian.org/testing/allpackages
Resolving packages.debian.org (packages.debian.org)... 5.153.231.3, 2001:41c8:1000:21::21:3, 2001:8d8:880:901::1a1:4
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://packages.debian.org/testing/allpackages [following]
--2014-10-08 01:52:11--  https://packages.debian.org/testing/allpackages
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 10110498 (9.6M) [text/html]
Saving to: ‘allpackages’

 9% [========>                                                                                              ] 9,49,116    55.5KB/s  eta 1m 48s 
Terminated

これら 2 つのカウント間でバイト サイズの差が 100% 以上あるのはなぜだと思いますか? 1 つは 4.9 MB で、もう 1 つは 9.6 MB です。

編集:フォローアップの質問Debian jessie で固有の「アプリケーション」の数を見つける方法

答え1

[text/html]2番目に ではなく と書かれていることに注目してください[text/plain]。パッケージリストを取得しているのではなく、含むパッケージ リストとその他のさまざまな書式設定。

しかし、実際には、圧縮バージョンを取得する必要があります。そうすれば、あなたと Debian の両方の時間とお金を節約できます。これは、1 つのコマンドで実行できます。

wget 'http://packages.debian.org/testing/allpackages?format=txt.gz' -O - | gunzip > allpackages.txt

または、行数を直接数えます (ただし、ファイルの先頭に余分な行があるため、少しずれることに注意してください)。

wget 'http://packages.debian.org/testing/allpackages?format=txt.gz' -O - | gunzip | wc -l

関連情報