Извлечь имя хоста URL-адреса

Извлечь имя хоста URL-адреса

Существует ли какой-либо стандартизированный или широко используемый метод извлечения чего-то вроде «имени хоста верхнего уровня» из URL?

Например, для http://images.google.comменя это желательно google.com(даже если images.подключается к другому серверу http://google.com), тогда как http://www.amazon.co.ukследует дать amazon.co.uk.

Поэтому мне нравится получать имя хоста без каких-либо поддоменов.

решение1

Mozilla ведет список ограничений для доменов второго уровня.

Описание:http://publicsuffix.org/learn/

Список:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1

Этот список можно проанализировать, а полученные правила использовать для определения того, является ли домен второго уровня ограниченным и, следовательно, включает ли имя хоста домен третьего уровня.

Связанный контент