![Как заставить wget точно сопоставлять доменные имена?](https://rvso.com/image/1413942/%D0%9A%D0%B0%D0%BA%20%D0%B7%D0%B0%D1%81%D1%82%D0%B0%D0%B2%D0%B8%D1%82%D1%8C%20wget%20%D1%82%D0%BE%D1%87%D0%BD%D0%BE%20%D1%81%D0%BE%D0%BF%D0%BE%D1%81%D1%82%D0%B0%D0%B2%D0%BB%D1%8F%D1%82%D1%8C%20%D0%B4%D0%BE%D0%BC%D0%B5%D0%BD%D0%BD%D1%8B%D0%B5%20%D0%B8%D0%BC%D0%B5%D0%BD%D0%B0%3F.png)
Я использую следующую команду для зеркалирования сайта:
wget -r -p -E -N -l 10 -k -nH -H -Dfoo.com,www.foo.com foo.com
Проблема, с которой я столкнулся, заключается в том, что где-то на foo.com есть ссылки на домены, заканчивающиеся на foo.com (например, newfoo.com), и wget также зеркалирует этот сайт. Возможно ли ограничить домены точным совпадением? Я не хочу сканировать никакие поддомены, кроме www.
решение1
К сожалению, wget выполняет мягкое сопоставление принятых доменов при сканировании сайта. Например, все следующие домены будут соответствовать foo.com:
- barfoo.com
- bar.foo.com
- что угодно.можно.перейти.foo.com
Я на самом деле создалпластырьдля wget 1.15, чтобы добавить опцию для включения этого строгого поведения соответствия. Используя этот патч, весь домен должен точно соответствовать. Это не влияет на другие списки доменов, такие как исключенные домены и т. д.