Tengo una lista de n números (se conoce n) de URL. ¿Cómo puedo eliminar el nombre del protocolo de la URL?
Por ejemplo: de https://xyz.com
, quiero recuperar xyz.com
solo una parte.
Respuesta1
Usando GNU grep y PCRE,
grep -oP 'https://\K\S+' file
Eso genera los espacios que no son espacios después de "https://"
Respuesta2
Respuesta3
Aquí hay una invocación simple de awk:
$ awk -F// '{print $NF}' fileName
-F
especifica el separador de campo. $NF
imprime el último campo.
Es posible que necesites utilizar comillas dobles alrededor de //.
Respuesta4
Usandocortar: Funciona con o sin prefijo como corte también imprime líneas sin delimitador
echo 'https://myserver.com' | cut -d '/' -f 3
# prints myserver.com
Puedes usar un bucle para ejecutar esto en varias líneas dentro de un archivo:
for line in $(cat input_file.txt); do
echo "${line}" | cut -d '/' -f 3
done
Desde la página de manual "cortar" -f, --fields=LIST seleccione solo estos campos; También imprima cualquier línea que no contenga ningún carácter delimitador, a menos que se especifique la opción -s.