allpackages.txt.gz에는 두 가지 파일 크기가 있습니까?

allpackages.txt.gz에는 두 가지 파일 크기가 있습니까?

나는 보았다http://linux.koolsolutions.com/2008/12/19/counting-number-of-packages-under-debian-linux/테스트 중인 패키지 수를 세고 싶었습니다.

나는 거기에서 공유하려고 시도했습니다 :-

http://packages.debian.org/testing/allpackages?format=txt.gz
Resolving packages.debian.org (packages.debian.org)... 5.153.231.3, 2001:41c8:1000:21::21:3, 2001:8d8:880:901::1a1:4
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://packages.debian.org/testing/allpackages?format=txt.gz [following]
--2014-10-08 01:52:54--  https://packages.debian.org/testing/allpackages?format=txt.gz
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1039782 (1015K) [text/plain]
Saving to: ‘allpackages?format=txt.gz’

100%[======================================================================================================>] 10,39,782   64.0KB/s   in 13s    

$ mv allpackages\?format=txt.gz allpackages.txt.gz

$ gunzip allpackages.txt.gz

$ ll -h allpackages.txt 
-rw-r--r-- 1 shirish shirish 4.9M Oct  7 23:53 allpackages.txt

그러나 압축하지 않고 모든 패키지를 얻으려고 하면 다음과 같은 결과가 나타납니다.

$ wget http://packages.debian.org/testing/allpackages
--2014-10-08 01:52:11--  http://packages.debian.org/testing/allpackages
Resolving packages.debian.org (packages.debian.org)... 5.153.231.3, 2001:41c8:1000:21::21:3, 2001:8d8:880:901::1a1:4
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://packages.debian.org/testing/allpackages [following]
--2014-10-08 01:52:11--  https://packages.debian.org/testing/allpackages
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 10110498 (9.6M) [text/html]
Saving to: ‘allpackages’

 9% [========>                                                                                              ] 9,49,116    55.5KB/s  eta 1m 48s 
Terminated

이 두 개수 사이의 바이트 크기 차이가 100% 이상인 이유를 아시나요? 하나는 4.9MB이고 다른 하나는 9.6MB입니까?

편집 : 후속 질문데비안 jessie에서 고유한 '응용 프로그램' 수를 찾는 방법

답변1

[text/html]가 아닌 두 번째 항목에 대해 어떻게 말하는지 확인하세요 [text/plain]. 패키지 목록을 가져오는 것이 아니라 다음과 같은 웹페이지를 가져오는 것입니다.포함다른 형식과 함께 패키지 목록.

하지만 실제로는 압축된 버전을 가져오고 싶습니다. 그것은 당신과 데비안의 시간과 돈을 모두 절약해 줄 것입니다. 하나의 명령으로 이를 수행할 수 있습니다.

wget 'http://packages.debian.org/testing/allpackages?format=txt.gz' -O - | gunzip > allpackages.txt

또는 직접 줄 수를 계산합니다(단, 파일 시작 부분에 추가 줄이 있기 때문에 약간씩 차이가 있다는 점에 유의하세요).

wget 'http://packages.debian.org/testing/allpackages?format=txt.gz' -O - | gunzip | wc -l

관련 정보