URLのホスト名を抽出する

URLのホスト名を抽出する

URL から「トップレベルのホスト名」のようなものを抽出するための標準化された、または広く使用されている方法はありますか?

たとえば、 についてはが であること( が別のサーバーに接続する場合でも となる)http://images.google.comを好みますが、を与えるべきです。google.comimages.http://google.comhttp://www.amazon.co.ukamazon.co.uk

したがって、サブドメインを削除したホスト名を取得するのがよいでしょう。

答え1

Mozilla は、第 2 レベル ドメインの制限をまとめたリストを管理しています。

説明:http://publicsuffix.org/learn/

リスト:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1

このリストを解析し、導出されたルールを使用して、第 2 レベル ドメインが制限されているかどうか、つまりホスト名に第 3 レベル ドメインが含まれているかどうかを検出できます。

関連情報