
¿Existe algún método estandarizado o ampliamente utilizado para extraer algo como un "nombre de host de nivel superior" de una URL?
Por ejemplo, para http://images.google.com
mí me gustaría tener google.com
(incluso si images.
se conecta a un servidor diferente también http://google.com
lo haría), mientras que http://www.amazon.co.uk
debería darle amazon.co.uk
.
Por eso me gusta eliminar el nombre de host con cualquier subdominio.
Respuesta1
Mozilla mantiene una lista compilada de restricciones de dominio de segundo nivel.
Descripción:http://publicsuffix.org/learn/
La lista:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1
Esta lista podría analizarse y las reglas derivadas podrían usarse para detectar si el dominio de segundo nivel es restringido y, por lo tanto, el nombre de host incluye el dominio de tercer nivel.