從輸入檔中提取唯一的子網域

2024-6-12 • tag-icon

我有一個.txt 文件，其中有200 萬行，其中包含同一網域的URL，我只需要提取此列表中唯一的子網域...問題是當我使用下面的命令時，輸出會返回整個唯一的URL ，我只需要提取唯一的子網域而不是整個URL，不重複。有小費嗎？謝謝<3

cat all-urls.txt | grep domain.com.br | uniq -u

我需要的輸出是這樣的：

https://sub1.domain.com
https://sub2.domain.com
https://sub3.domain.com
https://sub4.domain.com
https://sub5.domain.com
(...)

cut -d/ -f3 all-urls.txt | sort -u

然後我什至沒有無用地使用cat.

相關內容