Si algún nombre de dominio se vuelve obsoleto, generalmente aún responde a las solicitudes HTTP con algunos enlaces inútiles, a veces incluso sin un mensaje explícito "Este dominio está vencido/en venta" en lugar de simplemente no resolverse en absoluto.
¿Cómo determinar automáticamente el dominio "muerto" (caducado/no prolongado) sin un navegador? ¿Se puede hacer con whois
herramienta?
Esperando algo como esto:
while true; do
if ! checkdomain something-on-verge-of-abandoning-business.com; then
echo "Good night, sweet prince"
break
fi
sleep 1d
done
Por ejemplo, veamos el dominio allmydata.com
. Por lo que veo sobre Allmydata, debería haber algún servicio de respaldo basado en Tahoe-LAFS allí. Pero en realidad es un dominio estacionado.
$ whois allmydata.com
...
Domain Name: ALLMYDATA.COM
Registrar: DOMAIN MONKEYS, LLC
Whois Server: whois.domainmonkeys.com
Referral URL: http://www.domainmonkeys.com
Name Server: NS1.DSREDIRECTION.COM
Name Server: NS2.DSREDIRECTION.COM
Status: clientTransferProhibited
Updated Date: 04-aug-2013
Creation Date: 03-aug-2004
Expiration Date: 03-aug-2014
...
$ dig +short -t A allmydata.com @8.8.8.8
208.73.211.247
Esta verificación superficial muestra que se trata de un buen dominio. Pero, ¿cómo detectar de manera confiable (es decir, sin analizar heurísticamente la página y medir el "spam" o el "estacionamiento" del contenido) tal cosa?
Respuesta1
Podrías usar Python para leer el contenido html y luego buscar "dominio disponible"/"estacionado"/"renovación", etc. y otras palabras clave. Puede alimentarlo con un archivo CSV de dominios y luego generar los resultados como CSV y ahí tendrá una lista de dominios.
La otra idea sería analizar registros whois usando algo comoestey analizar los resultados para la fecha de renovación. Así es como lo haría.