
URL から「トップレベルのホスト名」のようなものを抽出するための標準化された、または広く使用されている方法はありますか?
たとえば、 についてはが であること( が別のサーバーに接続する場合でも となる)http://images.google.com
を好みますが、を与えるべきです。google.com
images.
http://google.com
http://www.amazon.co.uk
amazon.co.uk
したがって、サブドメインを削除したホスト名を取得するのがよいでしょう。
答え1
Mozilla は、第 2 レベル ドメインの制限をまとめたリストを管理しています。
説明:http://publicsuffix.org/learn/
リスト:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1
このリストを解析し、導出されたルールを使用して、第 2 レベル ドメインが制限されているかどうか、つまりホスト名に第 3 レベル ドメインが含まれているかどうかを検出できます。