URL의 호스트 이름 추출

URL의 호스트 이름 추출

URL에서 '최상위 호스트 이름'과 같은 것을 추출하는 표준화되거나 널리 사용되는 방법이 있습니까?

예를 들어, 나는 ( 다른 서버에 연결 하더라도 ) http://images.google.com갖고 싶어 하지만 을 제공해야 합니다 .google.comimages.http://google.comhttp://www.amazon.co.ukamazon.co.uk

그래서 저는 하위 도메인이 제거된 호스트 이름을 얻고 싶습니다.

답변1

Mozilla는 두 번째 수준 도메인 제한 사항의 컴파일된 목록을 유지 관리합니다.

설명:http://publicsuffix.org/learn/

목록:http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1

이 목록은 구문 분석될 수 있으며 파생된 규칙을 사용하여 두 번째 수준 도메인이 제한된 도메인인지, 따라서 호스트 이름에 세 번째 수준 도메인이 포함되는지 감지할 수 있습니다.

관련 정보