
Существует ли какой-либо стандартизированный или широко используемый метод извлечения чего-то вроде «имени хоста верхнего уровня» из URL?
Например, для http://images.google.com
меня это желательно google.com
(даже если images.
подключается к другому серверу http://google.com
), тогда как http://www.amazon.co.uk
следует дать amazon.co.uk
.
Поэтому мне нравится получать имя хоста без каких-либо поддоменов.
решение1
Mozilla ведет список ограничений для доменов второго уровня.
Описание:http://publicsuffix.org/learn/
Список:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1
Этот список можно проанализировать, а полученные правила использовать для определения того, является ли домен второго уровня ограниченным и, следовательно, включает ли имя хоста домен третьего уровня.