
Gibt es eine standardisierte oder weit verbreitete Methode, um so etwas wie einen „Hostnamen der obersten Ebene“ aus einer URL zu extrahieren?
Beispielsweise für http://images.google.com
Ich hätte gerne google.com
(auch wenn images.
eine Verbindung zu einem anderen Server als http://google.com
gewünscht hergestellt würde), wobei http://www.amazon.co.uk
geben sollte amazon.co.uk
.
Daher möchte ich den Hostnamen erhalten, ohne dass die Subdomäne entfernt wird.
Antwort1
Mozilla führt eine zusammengestellte Liste mit Beschränkungen für Second-Level-Domains.
Beschreibung:http://publicsuffix.org/learn/
Die Liste:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1
Diese Liste könnte analysiert und die abgeleiteten Regeln könnten verwendet werden, um zu erkennen, ob es sich bei der Second-Level-Domain um eine eingeschränkte Domain handelt und der Hostname daher die Third-Level-Domain enthält.