Rastrear sitio web con Wget con filtro por patrones de URL

Rastrear sitio web con Wget con filtro por patrones de URL

Estoy intentando rastrear un sitio web y quiero que wget siga de forma recursiva todos los enlaces (que están dentro del mismo dominio) pero solo descargue la página si la URL de esa página coincide con un patrón.

Intenté algo como esto:

wget https://www.abc.def --no-clobber -r -e robots=off -U mozilla --domains abc.def --html-extension --accept-regex 'https://www.abc.def/g/h/.*'

De hecho, solo descarga páginas con 'https://www.abc.def/g/h/.*' patrón. Sin embargo, no intenta seguir otros enlaces en absoluto.

¿Alguna idea?

¡Gracias de antemano!

información relacionada