
Existe algum método padronizado ou amplamente utilizado para extrair algo como um 'nome de host de nível superior' de um URL?
Por exemplo, para http://images.google.com
eu gosto de ter google.com
(mesmo que images.
conecte um servidor diferente como http://google.com
faria), enquanto http://www.amazon.co.uk
deveria dar amazon.co.uk
.
Gosto de obter o nome do host com qualquer subdomínio removido.
Responder1
A Mozilla mantém uma lista compilada de restrições de domínio de segundo nível.
Descrição:http://publicsuffix.org/learn/
A lista:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1
Esta lista poderia ser analisada e as regras derivadas poderiam ser usadas para detectar se o domínio de segundo nível é restrito e, portanto, o nome do host inclui o domínio de terceiro nível.