ファイルのダウンロードを自動化するにはどうすればいいですか?

Question 1

入力HTMLファイルを指定するには、

wget -F -i <file>

つまり、HTML ファイルをダンプしてループするだけです
(相対リンクのベース URL を追加しました)。

for i in <whereYouDumpedFiles>/*.html
do
  wget -F -B <base-url> -i $i
done

あるいは

何らかの方法でリンクをファイルにダンプし（改行で区切って）、次のようにします。

wget -i <url-file>

これらのリンクにアクセスする良い方法は次のとおりです。

lynx -hiddenlinks=ignore -nonumbers -listonly --dump <relevant-url> \
 | sort | uniq | sed /<regexp-pattern-of-urls-you-want>/\!d

おそらく 'url-file' に追加する for ループ内

Answer

入力HTMLファイルを指定するには、

wget -F -i <file>

つまり、HTML ファイルをダンプしてループするだけです
(相対リンクのベース URL を追加しました)。

for i in <whereYouDumpedFiles>/*.html
do
  wget -F -B <base-url> -i $i
done

あるいは

何らかの方法でリンクをファイルにダンプし（改行で区切って）、次のようにします。

wget -i <url-file>

これらのリンクにアクセスする良い方法は次のとおりです。

lynx -hiddenlinks=ignore -nonumbers -listonly --dump <relevant-url> \
 | sort | uniq | sed /<regexp-pattern-of-urls-you-want>/\!d

おそらく 'url-file' に追加する for ループ内

Question 2

Python を使用する方が簡単かもしれません。これが Python を使用したソリューションです。Python がオプションでない場合は無視してください。:)

ウェブサイトをスクレイピングすることは合法だと思います。

archive_bookname/index.1-177.htmループしてそれらをスクラップする簡単なPythonスクリプトを書いてください美しいスープ、CSSクラスセレクターまたは単純な正規表現マッチングを使用してリンクを見つけ、urllib.urlretrieve()ファイルを取得するには、そのようにします。

Answer

Python を使用する方が簡単かもしれません。これが Python を使用したソリューションです。Python がオプションでない場合は無視してください。:)

ウェブサイトをスクレイピングすることは合法だと思います。

archive_bookname/index.1-177.htmループしてそれらをスクラップする簡単なPythonスクリプトを書いてください美しいスープ、CSSクラスセレクターまたは単純な正規表現マッチングを使用してリンクを見つけ、urllib.urlretrieve()ファイルを取得するには、そのようにします。

Question 3

または、Perl とその優れたモジュールである www::mechanize を使用することもできます。何かをまとめるのは非常に簡単で、公式の CPAN ドキュメントには多数の例があります。

Answer

または、Perl とその優れたモジュールである www::mechanize を使用することもできます。何かをまとめるのは非常に簡単で、公式の CPAN ドキュメントには多数の例があります。

ファイルのダウンロードを自動化するにはどうすればいいですか?

答え1

答え2

答え3

関連情報