
Я оставляю свой ПК включенным дома. Иногда, когда я на работе, мой ПК не может загрузить страницы, которые я хочу загрузить. Мне приходится подключаться к нему по ssh и перезагружать/перезапускать браузер. Это действительно раздражает, и я пытаюсь найти более простой способ сделать это. Я думал сделать снимок экрана и как-то проверить, похоже ли это на страницу 404, снимок экрана которой я сделал раньше. Но это может слишком сильно потреблять ресурсы моей системы.
Я пытался поймать заголовок страницы с помощью xdotool
, но это не удалось.
Есть ли способ обнаружить страницы 404? Я использую браузер Chromium с Ubuntu. Эти веб-страницы недоступны с моего компьютера из-за моего интернет-соединения/компьютера. Веб-страница всегда открыта, но иногда из-за проблем с подключением браузер показывает 404 с этим маленьким динозавром. Вот мой код xdotool:
#!/usr/local/bin/xdotool
a=`xdotool search "http://a.com is not available - Chromium" | head -1`
if [[ $a ]]; then
echo "yes"
else
echo "nope"
fi
решение1
Как насчет wget
?
Три примера: один на несуществующую страницу, один на существующую страницу, которую вам запрещено загружать, и один, который работает.
wgethttps://askubuntu.com/testfor404
--2014-05-09 22:06:20-- https://askubuntu.com/testfor404
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 404 Not Found
2014-05-09 22:06:21 ERROR 404: Not Found.
wgethttps://askubuntu.com/reputation
--2014-05-09 22:07:11-- https://askubuntu.com/reputation
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 403 Forbidden
2014-05-09 22:07:11 ERROR 403: Forbidden.
--2014-05-09 22:07:36-- https://askubuntu.com/
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 69629 (68K) [text/html]
Saving to: ‘index.html’
100%[======================================>] 69.629 257KB/s in 0,3s
2014-05-09 22:07:36 (257 KB/s) - ‘index.html’ saved [69629/69629]
Эту команду можно расширить, чтобы она отображала «true» или «false» в случае, если в выводе отображается «ERROR 404: Not Found».
Опция --delete-after
удалит index.html после его загрузки. --spider
Флаг проверит заголовок/статус страницы без загрузки.