Как-то обнаружить 404

Как-то обнаружить 404

Я оставляю свой ПК включенным дома. Иногда, когда я на работе, мой ПК не может загрузить страницы, которые я хочу загрузить. Мне приходится подключаться к нему по ssh и перезагружать/перезапускать браузер. Это действительно раздражает, и я пытаюсь найти более простой способ сделать это. Я думал сделать снимок экрана и как-то проверить, похоже ли это на страницу 404, снимок экрана которой я сделал раньше. Но это может слишком сильно потреблять ресурсы моей системы.

Я пытался поймать заголовок страницы с помощью xdotool, но это не удалось.

Есть ли способ обнаружить страницы 404? Я использую браузер Chromium с Ubuntu. Эти веб-страницы недоступны с моего компьютера из-за моего интернет-соединения/компьютера. Веб-страница всегда открыта, но иногда из-за проблем с подключением браузер показывает 404 с этим маленьким динозавром. Вот мой код xdotool:

#!/usr/local/bin/xdotool
a=`xdotool search "http://a.com is not available - Chromium" | head -1`
if [[ $a ]]; then
    echo "yes"
else
    echo "nope"
fi

решение1

Как насчет wget?

Три примера: один на несуществующую страницу, один на существующую страницу, которую вам запрещено загружать, и один, который работает.

wgethttps://askubuntu.com/testfor404

--2014-05-09 22:06:20--  https://askubuntu.com/testfor404
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 404 Not Found
2014-05-09 22:06:21 ERROR 404: Not Found.

wgethttps://askubuntu.com/reputation

--2014-05-09 22:07:11--  https://askubuntu.com/reputation
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 403 Forbidden
2014-05-09 22:07:11 ERROR 403: Forbidden.

wgethttp://askubuntu.com

--2014-05-09 22:07:36--  https://askubuntu.com/
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 69629 (68K) [text/html]
Saving to: ‘index.html’

100%[======================================>] 69.629       257KB/s   in 0,3s   

2014-05-09 22:07:36 (257 KB/s) - ‘index.html’ saved [69629/69629]

Эту команду можно расширить, чтобы она отображала «true» или «false» в случае, если в выводе отображается «ERROR 404: Not Found».


Опция --delete-afterудалит index.html после его загрузки. --spiderФлаг проверит заголовок/статус страницы без загрузки.

Связанный контент