Wenn ein Domänenname veraltet ist, antwortet er auf HTTP-Anfragen normalerweise immer noch mit einer Reihe nutzloser Links, manchmal sogar ohne die explizite Meldung „Diese Domäne ist abgelaufen/zum Verkauf“, anstatt die Auflösung einfach komplett zu scheitern.
Wie kann man ohne Browser automatisch eine „tote“ (abgelaufene/nicht verlängerte) Domain ermitteln? Ist das mit einem Tool möglich whois
?
Erwarte so etwas:
while true; do
if ! checkdomain something-on-verge-of-abandoning-business.com; then
echo "Good night, sweet prince"
break
fi
sleep 1d
done
Schauen wir uns beispielsweise die Domäne an allmydata.com
. Soweit ich Allmydata sehe, sollte es dort einen Tahoe-LAFS-basierten Backup-Dienst geben. Aber eigentlich handelt es sich um eine geparkte Domäne.
$ whois allmydata.com
...
Domain Name: ALLMYDATA.COM
Registrar: DOMAIN MONKEYS, LLC
Whois Server: whois.domainmonkeys.com
Referral URL: http://www.domainmonkeys.com
Name Server: NS1.DSREDIRECTION.COM
Name Server: NS2.DSREDIRECTION.COM
Status: clientTransferProhibited
Updated Date: 04-aug-2013
Creation Date: 03-aug-2004
Expiration Date: 03-aug-2014
...
$ dig +short -t A allmydata.com @8.8.8.8
208.73.211.247
Diese oberflächliche Prüfung zeigt, dass es sich um eine gute Domain handelt. Aber wie kann man so etwas zuverlässig erkennen (d. h. nicht durch heuristisches Parsen der Seite und Messen des „Spam-Gehalts“ oder „Geparkt-Gehalts“ des Inhalts)?
Antwort1
Sie könnten einfach Python verwenden, um den HTML-Inhalt einzulesen und dann nach „Domain verfügbar“/„geparkt“/„Verlängerung“ usw. und anderen Schlüsselwörtern zu suchen. Sie können eine CSV-Datei mit Domains eingeben und die Ergebnisse dann als CSV ausgeben. Schon haben Sie eine Liste mit Domains.
Die andere Idee wäre, Whois-Einträge mit etwas wieDasund die Ergebnisse für das Verlängerungsdatum analysieren. So würde ich es machen.