
自宅では PC を稼働させています。仕事中は、PC が読み込みたいページを読み込めないことがあります。SSH で接続し、ブラウザを再起動しなければなりません。これは本当に面倒なので、もっと簡単な方法を探しています。スクリーンショットを撮って、以前スクリーンショットを撮った 404 ページと似ているかどうか確認しようかと考えました。しかし、システム リソースを少し使いすぎるかもしれません。
でページのタイトルをキャッチしようとしましたxdotool
が、失敗しました。
404 ページを検出する方法はありますか? Ubuntu で Chromium ブラウザを使用しています。インターネット接続/コンピュータが原因で、これらの Web ページにはコンピュータからアクセスできません。Web ページは常に表示されていますが、接続の問題により、ブラウザに小さな恐竜の 404 が表示されることがあります。これが私の xdotool コードです:
#!/usr/local/bin/xdotool
a=`xdotool search "http://a.com is not available - Chromium" | head -1`
if [[ $a ]]; then
echo "yes"
else
echo "nope"
fi
答え1
どうですかwget
?
3 つの例: 存在しないページへの 1 つ、ダウンロードが許可されていない既存のページへの 1 つ、そして機能するページへの 1 つです。
wgethttps://askubuntu.com/testfor404
--2014-05-09 22:06:20-- https://askubuntu.com/testfor404
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 404 Not Found
2014-05-09 22:06:21 ERROR 404: Not Found.
wgethttps://askubuntu.com/reputation
--2014-05-09 22:07:11-- https://askubuntu.com/reputation
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 403 Forbidden
2014-05-09 22:07:11 ERROR 403: Forbidden.
--2014-05-09 22:07:36-- https://askubuntu.com/
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 69629 (68K) [text/html]
Saving to: ‘index.html’
100%[======================================>] 69.629 257KB/s in 0,3s
2014-05-09 22:07:36 (257 KB/s) - ‘index.html’ saved [69629/69629]
出力に「ERROR 404: Not Found」と表示される場合、そのコマンドは「true」または「false」を表示するように拡張できます。
このオプションは、--delete-after
ダウンロード後に index.html を削除します。--spider
フラグは、ダウンロードせずにページ ヘッダー/ステータスをチェックします。