Cómo leer la entrada del usuario línea por línea hasta Ctrl+D e incluir la línea donde se escribió Ctrl+D

Question 1

Para hacer eso, tendrías que leer carácter por carácter, no línea por línea.

¿Por qué? Es muy probable que el shell utilice la función de biblioteca estándar de C read() para leer los datos que el usuario está escribiendo, y esa función devuelve el número de bytes realmente leídos. Si devuelve cero, significa que ha encontrado EOF (consulte el read(2)manual; man 2 read). Tenga en cuenta que EOF no es un carácter sino una condición, es decir, la condición "no hay nada más que leer",fin del documento.

Ctrl+Denvía uncarácter de fin de transmisión (EOT, código de caracteres ASCII 4, $'\04'en bash) al controlador del terminal. Esto tiene el efecto de enviar todo lo que haya que enviar a la read()llamada en espera del shell.

Cuando presionas Ctrl+Da la mitad de ingresar el texto en una línea, todo lo que hayas escrito hasta ahora se envía al shell ¹ . Esto significa que si ingresas Ctrl+Ddos veces después de haber escrito algo en una línea, la primera enviará algunos datos y la segunda enviaránada, y la read()llamada devolverá cero y el shell lo interpretará como EOF. Del mismo modo, si presiona Enterseguido de Ctrl+D, el shell obtiene EOF de inmediato ya que no había ningún dato para enviar.

Entonces, ¿cómo evitar tener que escribir Ctrl+Ddos veces?

Como dije, lea caracteres individuales. Cuando utiliza el readcomando integrado del shell, probablemente tenga un búfer de entrada y solicite read()leer un máximo de esa cantidad de caracteres del flujo de entrada (tal vez 16 kb aproximadamente). Esto significa que el shell obtendrá un montón de fragmentos de entrada de 16 kb, seguidos de un fragmento que puede tener menos de 16 kb, seguido de cero bytes (EOF). Una vez que se encuentra el final de la entrada (o una nueva línea, o un delimitador específico), el control regresa al script.

Si usa read -n 1para leer un solo carácter, el shell usará un buffer de un solo byte en su llamada a read(), es decir, se ubicará en un bucle cerrado leyendo carácter por carácter, devolviendo el control al script del shell después de cada uno.

El único problema read -nes que configura el terminal en "modo sin formato", lo que significa que los caracteres se envían tal como están sin ninguna interpretación. Por ejemplo, si presiona Ctrl+D, obtendrá un carácter EOT literal en su cadena. Así que tenemos que comprobarlo. Esto también tiene el efecto secundario de que el usuario no podrá editar la línea antes de enviarla al script, por ejemplo presionando Backspaceo usando Ctrl+W(para eliminar la palabra anterior) o Ctrl+U(para eliminar al principio de la línea). .

Para acortar una historia larga:El siguiente es el bucle final que su bashsecuencia de comandos debe realizar para leer una línea de entrada y, al mismo tiempo, permite al usuario interrumpir la entrada en cualquier momento presionando Ctrl+D:

while true; do
    line=''

    while IFS= read -r -N 1 ch; do
        case "$ch" in
            $'\04') got_eot=1   ;&
            $'\n')  break       ;;
            *)      line="$line$ch" ;;
        esac
    done

    printf 'line: "%s"\n' "$line"

    if (( got_eot )); then
        break
    fi
done

Sin entrar en demasiados detalles sobre esto:

IFS=borra la IFSvariable. Sin esto, no podríamos leer espacios. Lo uso read -Nen lugar de read -n, de lo contrario no podríamos detectar nuevas líneas. La -ropción readnos permite leer las barras invertidas correctamente.
La casedeclaración actúa sobre cada carácter leído ( $ch). Si se detecta un EOT ( $'\04'), se establece got_eoten 1 y luego pasa a la breakdeclaración que lo saca del bucle interno. Si se detecta una nueva línea ( $'\n'), simplemente sale del bucle interno. De lo contrario, agrega el carácter al final de la linevariable.
Después del bucle, la línea se imprime en la salida estándar. Aquí sería donde llamarías a tu script o función que usa "$line". Si llegamos hasta aquí detectando un EOT, salimos del bucle más externo.

¹ Puede probar esto ejecutando cat >fileen una terminal y tail -f fileen otra, y luego ingresar una línea parcial en caty presionar Ctrl+Dpara ver qué sucede en la salida de tail.

Para ksh93los usuarios: el bucle anterior leerá un carácter de retorno de carro en lugar de un carácter de nueva línea en ksh93, lo que significa que la prueba para $'\n'deberá cambiar a una prueba para $'\r'. El shell también los mostrará como ^M.

Para solucionar esto:

stty_saved="$(stty -g)"
stty-echoctl

#el bucle va aquí, con $'\n' reemplazado por $'\r'

stty "$stty_saved"

También es posible que desee generar una nueva línea explícitamente justo antes para breakobtener exactamente el mismo comportamiento que en bash.

Answer