wget tgz ファイルを HTML に変換する

wget tgz ファイルを HTML に変換する

ダウンロードしようとしています.tgzdebian のファイルなので、これを使用することにしましたwget。これが私のコマンドラインです:

~$ wget http://www.netmet-solutions.org/download/netMETdistrib-4.5_5.8_20160322.tgz

ファイルを入手しました。タール私もです

~$ tar -zxvf netMETdistrib-4.5_5.8_20160322.tgz

そしてこう言う

gzip: stdin: not in gzip format

ファイルを確認すると、これが表示されます

netMETdistrib-4.5_5.8_20160322.tgz: HTML document, ISO-8859 text, with very long lines

wget変換されたtgzHTML 形式のファイルですが、理由がわかりません。

何かアイデアはありますか?ありがとう

答え1

http://www.netmet-solutions.org/download/netMETdistrib-4.5_5.8_20160322.tgzリダイレクトが強制されているhttp://www.netmet-solutions.org/Telechargement/Telechargement(標準の HTML ページ)。つまり、基本的には .tgz ファイルではなく、単純な HTML ページをダウンロードすることになります。wget の出力はリダイレクトを確認します。

➤ wget http://www.netmet-solutions.org/download/netMETdistrib-4.5_5.8_20160322.tgz
--2017-04-14 11:14:43--  http://www.netmet-solutions.org/download/netMETdistrib-4.5_5.8_20160322.tgz
Resolving www.netmet-solutions.org... 193.50.27.134
Connecting to www.netmet-solutions.org|193.50.27.134|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: /Telechargement/Telechargement [following]
--2017-04-14 11:14:44--  http://www.netmet-solutions.org/Telechargement/Telechargement
Connecting to www.netmet-solutions.org|193.50.27.134|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: `netMETdistrib-4.5_5.8_20160322.tgz'

編集:基本的に、アーカイブをダウンロードするには、CeCILLライセンスに同意する必要があります(http://www.netmet-solutions.org/Telechargement/Jaccepte)。wget 経由でこれを行うには、ヘッダーで必要な Cookie を渡す必要があります。

wget --no-cookies --header "Cookie: accepted_licence=chocolat" http://www.netmet-solutions.org/download/netMETdistrib-4.5_5.8_20160322.tgz

結果のファイルは gzip 圧縮データとして認識されます。

➤ file netMETdistrib-4.5_5.8_20160322.tgz
netMETdistrib-4.5_5.8_20160322.tgz: gzip compressed data, last modified: Tue Mar 22 12:39:36 2016, from Unix

関連情報