입력 파일에서 고유한 하위 도메인 추출

2024-6-11 • tag-icon

동일한 도메인의 URL이 포함된 200만 줄의 .txt 파일이 있습니다. 이 목록의 고유한 하위 도메인만 추출해야 합니다... 문제는 아래 명령을 사용할 때 출력이 전체 고유 URL을 반환한다는 것입니다. 반복 없이 전체 URL이 아닌 고유한 하위 도메인 이름을 추출해야 합니다. 어떤 팁이 있나요? 감사합니다<3

cat all-urls.txt | grep domain.com.br | uniq -u

출력은 다음과 같아야 합니다.

https://sub1.domain.com
https://sub2.domain.com
https://sub3.domain.com
https://sub4.domain.com
https://sub5.domain.com
(...)

답변1

cut -d/ -f3 all-urls.txt | sort -u

그리고 나는 쓸모없는 사용조차하지 않았습니다 cat.

답변1

관련 정보