Extrahieren des Hostnamens einer URL

Extrahieren des Hostnamens einer URL

Gibt es eine standardisierte oder weit verbreitete Methode, um so etwas wie einen „Hostnamen der obersten Ebene“ aus einer URL zu extrahieren?

Beispielsweise für http://images.google.comIch hätte gerne google.com(auch wenn images.eine Verbindung zu einem anderen Server als http://google.comgewünscht hergestellt würde), wobei http://www.amazon.co.ukgeben sollte amazon.co.uk.

Daher möchte ich den Hostnamen erhalten, ohne dass die Subdomäne entfernt wird.

Antwort1

Mozilla führt eine zusammengestellte Liste mit Beschränkungen für Second-Level-Domains.

Beschreibung:http://publicsuffix.org/learn/

Die Liste:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1

Diese Liste könnte analysiert und die abgeleiteten Regeln könnten verwendet werden, um zu erkennen, ob es sich bei der Second-Level-Domain um eine eingeschränkte Domain handelt und der Hostname daher die Third-Level-Domain enthält.

verwandte Informationen