Extraer el nombre de host de una URL

Extraer el nombre de host de una URL

¿Existe algún método estandarizado o ampliamente utilizado para extraer algo como un "nombre de host de nivel superior" de una URL?

Por ejemplo, para http://images.google.commí me gustaría tener google.com(incluso si images.se conecta a un servidor diferente también http://google.comlo haría), mientras que http://www.amazon.co.ukdebería darle amazon.co.uk.

Por eso me gusta eliminar el nombre de host con cualquier subdominio.

Respuesta1

Mozilla mantiene una lista compilada de restricciones de dominio de segundo nivel.

Descripción:http://publicsuffix.org/learn/

La lista:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1

Esta lista podría analizarse y las reglas derivadas podrían usarse para detectar si el dominio de segundo nivel es restringido y, por lo tanto, el nombre de host incluye el dominio de tercer nivel.

información relacionada