ウェブサイト内のすべてのウェブページのソース コードを取得して、単一のテキスト ファイルに保存する方法はありますか? Internet Explorer でページを個別に取得した場合と同じように、適切な CRFL 文字を使用しますか? Wget を試しましたが、適切なオプションの組み合わせが見つからないようです。
答え1
ウェブサーバーが正しく設定されていれば、これは不可能です。ウェブサイトのソースコードをダウンロードできれば、ウェブサイトのデータベース認証の詳細などの貴重なデータを取得できるためです。
ただし、レンダリングされたHTMLインターネット ブラウザに表示される Web ページは次のようになりますwget
。
wget -E -H -k -K -p URLHERE
wget
ただし、一部の Web サーバーはロボット (Web ページからデータを取得して保存するプログラム) として扱う場合があります。この場合は、コマンド-e robots=off
でスイッチを使用できますwget
。