일부 도메인 이름이 오래되어도 일반적으로 쓸모없는 링크가 잔뜩 포함된 HTTP 요청에 응답합니다. 때로는 전혀 확인하지 못하는 대신 "이 도메인은 만료되었습니다/판매 중입니다"라는 명시적인 메시지 없이도 응답합니다.
브라우저 없이 "죽은"(만료/연장되지 않은) 도메인을 자동으로 확인하는 방법은 무엇입니까? 도구 로 할 수 있나요 whois
?
다음과 같은 것을 기대합니다.
while true; do
if ! checkdomain something-on-verge-of-abandoning-business.com; then
echo "Good night, sweet prince"
break
fi
sleep 1d
done
예를 들어 domain 을 살펴보겠습니다 allmydata.com
. Allmydata에 대해 제가 아는 한, 거기에는 Tahoe-LAFS 기반 백업 서비스가 있어야 합니다. 그러나 실제로는 선점 도메인입니다.
$ whois allmydata.com
...
Domain Name: ALLMYDATA.COM
Registrar: DOMAIN MONKEYS, LLC
Whois Server: whois.domainmonkeys.com
Referral URL: http://www.domainmonkeys.com
Name Server: NS1.DSREDIRECTION.COM
Name Server: NS2.DSREDIRECTION.COM
Status: clientTransferProhibited
Updated Date: 04-aug-2013
Creation Date: 03-aug-2004
Expiration Date: 03-aug-2014
...
$ dig +short -t A allmydata.com @8.8.8.8
208.73.211.247
이 얕은 검사는 좋은 도메인인 것처럼 보여줍니다. 하지만 페이지를 경험적으로 분석하지 않고 콘텐츠에서 "스팸성" 또는 "주차성"을 측정하지 않고 어떻게 안정적으로 감지할 수 있을까요?
답변1
Python을 사용하여 HTML 콘텐츠를 읽은 다음 "사용 가능한 도메인"/"파킹된"/"갱신" 등 및 기타 키워드를 검색할 수 있습니다. 도메인의 CSV 파일을 제공한 다음 결과를 CSV로 출력하면 도메인 목록이 표시됩니다.
다른 아이디어는 다음과 같은 것을 사용하여 whois 기록을 구문 분석하는 것입니다.이것갱신 날짜에 대한 결과를 구문 분석합니다. 그게 내가 할 방법이야.