Obtenha os URLs do texto

Obtenha os URLs do texto

Eu recebo um arquivo de texto apt-get --print-uris dist-upgrade > /mnt/URIs.txt, quero baixar todos os pacotes com os URLs fornecidos pelo arquivo de texto, apenas o texto entre '' é URL, como remover o resto porque apenas URLs e símbolos de retorno são usados ​​para download pelo navegador da Internet .

Responder1

A saída de apt-get --print-uris dist-upgrademaio é mais ou menos assim:

Reading package lists...
Building dependency tree...
Reading state information...
Calculating upgrade...
The following packages will be upgraded:
  evolution-data-server evolution-data-server-common gir1.2-goa-1.0
  gnome-online-accounts libcamel-1.2-62 libebackend-1.2-10 libebook-1.2-20
  libebook-contacts-1.2-3 libecal-2.0-1 libedata-book-1.2-26
  libedata-cal-2.0-1 libedataserver-1.2-24 libedataserverui-1.2-2
  libgoa-1.0-0b libgoa-1.0-common libgoa-backend-1.0-1 libyelp0 linux-libc-dev
  python-apt-common python3-apt yelp
21 upgraded, 0 newly installed, 0 to remove and 0 not upgraded.
Need to get 4,358 kB of archives.
After this operation, 16.4 kB of additional disk space will be used.
'http://se.archive.ubuntu.com/ubuntu/pool/main/p/python-apt/python-apt-common_2.0.0ubuntu0.20.04.5_all.deb' python-apt-common_2.0.0ubuntu0.20.04.5_all.deb 17052 MD5Sum:a9e11f5f8671c5069f5edaef32e2f620
'http://se.archive.ubuntu.com/ubuntu/pool/main/p/python-apt/python3-apt_2.0.0ubuntu0.20.04.5_amd64.deb' python3-apt_2.0.0ubuntu0.20.04.5_amd64.deb 154164 MD5Sum:8590dd473b444f2756e5c7498e00e7ec
'http://se.archive.ubuntu.com/ubuntu/pool/main/g/gnome-online-accounts/libgoa-1.0-common_3.36.1-0ubuntu1_all.deb' libgoa-1.0-common_3.36.1-0ubuntu1_all.deb 3752 MD5Sum:9252da969452bdf88527829a752ac175

(esta saída está truncada)

Supondo que você queira analisar os URIs "limpos" acima, o sedcomando a seguir excluiria todas as linhas, desde a primeira até aquela que começa com a string After(inclusive). Das linhas restantes, ele excluiria tudo após o espaço e, em seguida, excluiria o primeiro e o último caracteres da linha modificada (isso excluiria as aspas simples em torno dos URIs).

sed '1,/^After/d; s/ .*//; s/.//; s/.$//'

Usando isso no meu breve exemplo de saída acima:

$ sed '1,/^After/d; s/ .*//; s/.//; s/.$//' file
http://se.archive.ubuntu.com/ubuntu/pool/main/p/python-apt/python-apt-common_2.0.0ubuntu0.20.04.5_all.deb
http://se.archive.ubuntu.com/ubuntu/pool/main/p/python-apt/python3-apt_2.0.0ubuntu0.20.04.5_amd64.deb
http://se.archive.ubuntu.com/ubuntu/pool/main/g/gnome-online-accounts/libgoa-1.0-common_3.36.1-0ubuntu1_all.deb

Dados os mesmos dados de entrada, o comando

sed -n "s,.*\(http://[^']*\).*,\1,p" file

também funcionaria. Isso tenta corresponder a qualquer substring que comece http://e termine antes de uma aspa simples. Em seguida, substitui a linha inteira por essa substring e imprime a linha modificada. Linhas não correspondentes são descartadas.

informação relacionada