我有一個.txt 文件,其中有200 萬行,其中包含同一網域的URL,我只需要提取此列表中唯一的子網域...問題是當我使用下面的命令時,輸出會返回整個唯一的URL ,我只需要提取唯一的子網域而不是整個URL,不重複。有小費嗎?謝謝<3
cat all-urls.txt | grep domain.com.br | uniq -u
我需要的輸出是這樣的:
https://sub1.domain.com
https://sub2.domain.com
https://sub3.domain.com
https://sub4.domain.com
https://sub5.domain.com
(...)
答案1
cut -d/ -f3 all-urls.txt | sort -u
然後我什至沒有無用地使用cat
.