wget -r の出力を理解する

Question

オプションを使用してファイルをスキップすることもできます--reject(ワイルドカードも受け入れます):

wget --reject index.html

ただし、これは実行しないでください。で wget を使用する場合-r、何らかの方法でディレクトリ内のファイルのリストを取得する必要があります。したがって、wget は index.html ファイルを要求し、このディレクトリ内の他のファイルへのパスを取得するためにコンテンツを解析します。フォルダーに index.html ファイルがない場合、通常は Web サーバーが wget 用にそれを生成します。このファイルにはディレクトリリストが含まれます。このリストファイルの作成は Web サーバーで有効にする必要があります。そうしないと、wget は HTTP 404 応答を受信し、再帰ダウンロードで失敗します。

これはバイト単位のファイルサイズです。
これは、ファイルを削除できなかったことを意味します (おそらく、最初に作成されなかったためです)。wget を使用してダウンロードしたディレクトリに対する書き込み権限がありますか?

編集：とを使用して wget のダウンロードをテストした後--spider、--recursive リンク解除エラーを再現しました。wget は、レスポンスのコンテンツタイプを使用して、ファイルに他のリソースへのリンクを含めることができるかどうかを判断しているようです。コンテンツタイプのテストが失敗し、ファイルがダウンロードされない場合、wget は、ダウンロードされたかのように一時ファイルを削除しようとします (これは、を使用して wget を再実行すると明らかです--debug。が明確に示されますRemoving file due to --spider in recursive_retrieve():)。wget のバグが見つかったと思います。

Answer 1

オプションを使用してファイルをスキップすることもできます--reject(ワイルドカードも受け入れます):

wget --reject index.html

ただし、これは実行しないでください。で wget を使用する場合-r、何らかの方法でディレクトリ内のファイルのリストを取得する必要があります。したがって、wget は index.html ファイルを要求し、このディレクトリ内の他のファイルへのパスを取得するためにコンテンツを解析します。フォルダーに index.html ファイルがない場合、通常は Web サーバーが wget 用にそれを生成します。このファイルにはディレクトリリストが含まれます。このリストファイルの作成は Web サーバーで有効にする必要があります。そうしないと、wget は HTTP 404 応答を受信し、再帰ダウンロードで失敗します。

これはバイト単位のファイルサイズです。
これは、ファイルを削除できなかったことを意味します (おそらく、最初に作成されなかったためです)。wget を使用してダウンロードしたディレクトリに対する書き込み権限がありますか?

編集：とを使用して wget のダウンロードをテストした後--spider、--recursive リンク解除エラーを再現しました。wget は、レスポンスのコンテンツタイプを使用して、ファイルに他のリソースへのリンクを含めることができるかどうかを判断しているようです。コンテンツタイプのテストが失敗し、ファイルがダウンロードされない場合、wget は、ダウンロードされたかのように一時ファイルを削除しようとします (これは、を使用して wget を再実行すると明らかです--debug。が明確に示されますRemoving file due to --spider in recursive_retrieve():)。wget のバグが見つかったと思います。

wget -r の出力を理解する

答え1

関連情報