Extraia o nome do host de um URL

Extraia o nome do host de um URL

Existe algum método padronizado ou amplamente utilizado para extrair algo como um 'nome de host de nível superior' de um URL?

Por exemplo, para http://images.google.comeu gosto de ter google.com(mesmo que images.conecte um servidor diferente como http://google.comfaria), enquanto http://www.amazon.co.ukdeveria dar amazon.co.uk.

Gosto de obter o nome do host com qualquer subdomínio removido.

Responder1

A Mozilla mantém uma lista compilada de restrições de domínio de segundo nível.

Descrição:http://publicsuffix.org/learn/

A lista:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1

Esta lista poderia ser analisada e as regras derivadas poderiam ser usadas para detectar se o domínio de segundo nível é restrito e, portanto, o nome do host inclui o domínio de terceiro nível.

informação relacionada