¿Allpackages.txt.gz tiene dos tamaños de archivo diferentes?

¿Allpackages.txt.gz tiene dos tamaños de archivo diferentes?

Yo vihttp://linux.koolsolutions.com/2008/12/19/counting-number-of-packages-under-debian-linux/y quería contar la cantidad de paquetes en prueba.

Lo intenté como se comparte allí: -

http://packages.debian.org/testing/allpackages?format=txt.gz
Resolving packages.debian.org (packages.debian.org)... 5.153.231.3, 2001:41c8:1000:21::21:3, 2001:8d8:880:901::1a1:4
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://packages.debian.org/testing/allpackages?format=txt.gz [following]
--2014-10-08 01:52:54--  https://packages.debian.org/testing/allpackages?format=txt.gz
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1039782 (1015K) [text/plain]
Saving to: ‘allpackages?format=txt.gz’

100%[======================================================================================================>] 10,39,782   64.0KB/s   in 13s    

$ mv allpackages\?format=txt.gz allpackages.txt.gz

$ gunzip allpackages.txt.gz

$ ll -h allpackages.txt 
-rw-r--r-- 1 shirish shirish 4.9M Oct  7 23:53 allpackages.txt

Sin embargo, si intento obtener todos los paquetes sin comprimirlos, obtengo lo siguiente:

$ wget http://packages.debian.org/testing/allpackages
--2014-10-08 01:52:11--  http://packages.debian.org/testing/allpackages
Resolving packages.debian.org (packages.debian.org)... 5.153.231.3, 2001:41c8:1000:21::21:3, 2001:8d8:880:901::1a1:4
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://packages.debian.org/testing/allpackages [following]
--2014-10-08 01:52:11--  https://packages.debian.org/testing/allpackages
Connecting to packages.debian.org (packages.debian.org)|5.153.231.3|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 10110498 (9.6M) [text/html]
Saving to: ‘allpackages’

 9% [========>                                                                                              ] 9,49,116    55.5KB/s  eta 1m 48s 
Terminated

¿Alguna idea de por qué hay más del 100% de diferencia en el tamaño de bytes entre estos dos recuentos? ¿Uno de 4,9 MB y el otro de 9,6 MB?

Editar: pregunta de seguimiento enCómo encontrar la cantidad de 'aplicaciones' únicas en Debian jessie

Respuesta1

Observe cómo dice [text/html]para el segundo, no [text/plain]. No estás buscando la lista de paquetes, estás buscando una página web quecontienela lista de paquetes, junto con muchos otros formatos.

Pero en realidad lo que desea es obtener la versión comprimida; les ahorrará tiempo y dinero tanto a usted como a Debian. Puedes hacerlo con un comando:

wget 'http://packages.debian.org/testing/allpackages?format=txt.gz' -O - | gunzip > allpackages.txt

O cuente las líneas directamente (pero tenga en cuenta que esto está un poco desviado debido a líneas adicionales al principio del archivo):

wget 'http://packages.debian.org/testing/allpackages?format=txt.gz' -O - | gunzip | wc -l

información relacionada