Detectando 404 de alguma forma

Detectando 404 de alguma forma

Eu mantenho meu PC funcionando em casa. Às vezes, quando estou no trabalho, meu PC não consegue carregar as páginas que desejo. Eu tenho que fazer ssh e reiniciar/reiniciar o navegador. É realmente chato e estou tentando encontrar uma maneira mais fácil de fazer isso. Pensei em fazer uma captura de tela e de alguma forma tentar verificar se se parece com uma página 404 da qual fiz uma captura de tela antes. Mas isso pode usar um pouco mais os recursos do meu sistema.

Tentei capturar o título da página com xdotool, mas falhou.

Existe uma maneira de detectar páginas 404? Estou usando o navegador chromium com Ubuntu. Essas páginas da Web não podem ser acessadas no meu computador devido à minha conexão com a Internet/computador. A página está sempre ativa, mas às vezes, por problemas de conexão, o navegador mostra 404 com aquele minúsculo dinossauro. Este é o meu código xdotool:

#!/usr/local/bin/xdotool
a=`xdotool search "http://a.com is not available - Chromium" | head -1`
if [[ $a ]]; then
    echo "yes"
else
    echo "nope"
fi

Responder1

Que tal wget?

Três exemplos: um para uma página não existente, um para uma página existente que você não tem permissão para baixar e um que funciona.

wgethttps://askubuntu.com/testfor404

--2014-05-09 22:06:20--  https://askubuntu.com/testfor404
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 404 Not Found
2014-05-09 22:06:21 ERROR 404: Not Found.

wgethttps://askubuntu.com/reputation

--2014-05-09 22:07:11--  https://askubuntu.com/reputation
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 403 Forbidden
2014-05-09 22:07:11 ERROR 403: Forbidden.

wgethttp://askubuntu.com

--2014-05-09 22:07:36--  https://askubuntu.com/
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 69629 (68K) [text/html]
Saving to: ‘index.html’

100%[======================================>] 69.629       257KB/s   in 0,3s   

2014-05-09 22:07:36 (257 KB/s) - ‘index.html’ saved [69629/69629]

Esse comando pode ser expandido para mostrar "true" ou "false" caso a saída mostre "ERROR 404: Not Found".


A opção --delete-afterexcluirá o index.html após baixá-lo. --spiderflag verificará o cabeçalho/status da página sem fazer download.

informação relacionada