¿Por qué awk imprime esta línea más de una vez?

Question 1

La condición /^mail:/no afecta todas las instrucciones que siguen, solo la primera ( mail = $2).

Como resultado, la segunda instrucción (print mail se ejecuta la segunda instrucción ( ).para cada línea.

Es por eso que en realidad hay algunas líneas en blanco al comienzo del resultado ( mailaún no está configurado).

Cualquiera de estos funcionará:

awk '/^mail:/ { { mail=$2 }; {print mail } };' ldif

awk '/^mail:/ { mail=$2; print mail };' ldif

Personalmente, preferiría:

awk '/^mail:/ { print $2 }' ldif

Answer

La condición /^mail:/no afecta todas las instrucciones que siguen, solo la primera ( mail = $2).

Como resultado, la segunda instrucción (print mail se ejecuta la segunda instrucción ( ).para cada línea.

Es por eso que en realidad hay algunas líneas en blanco al comienzo del resultado ( mailaún no está configurado).

Cualquiera de estos funcionará:

awk '/^mail:/ { { mail=$2 }; {print mail } };' ldif

awk '/^mail:/ { mail=$2; print mail };' ldif

Personalmente, preferiría:

awk '/^mail:/ { print $2 }' ldif

Question 2

@Dennis ofreció una solución que proporciona la sintaxis correcta, pero no respondió completamente a la pregunta original de "¿Por qué awk imprime esta línea más de una vez?"

Awk se ejecuta en un bucle orientado a líneas y, con excepciones menores (por ejemplo, BEGIN y END), ejecuta el script completo en cada línea de entrada. En el ejemplo del OP, se ejecutaba el siguiente pseudocódigo para cada línea del archivo de entrada:

if LINE starts with "mail:"
    set MAIL to value of second field of the input record
endif

print MAIL

El motivo de las líneas de salida duplicadas es que la declaración impresa esafuerala declaración condicional, y por lo tanto se ejecuta paracadalínea de entrada, en lugar de solo líneas que coincidan con la expresión regular. Además, dado que la mailvariable solo se establece dentro de la declaración condicional, el valor anterior se reutiliza una y otra vez hasta la próxima vez que una línea de entrada coincida con la declaración condicional.

Answer

@Dennis ofreció una solución que proporciona la sintaxis correcta, pero no respondió completamente a la pregunta original de "¿Por qué awk imprime esta línea más de una vez?"

Awk se ejecuta en un bucle orientado a líneas y, con excepciones menores (por ejemplo, BEGIN y END), ejecuta el script completo en cada línea de entrada. En el ejemplo del OP, se ejecutaba el siguiente pseudocódigo para cada línea del archivo de entrada:

if LINE starts with "mail:"
    set MAIL to value of second field of the input record
endif

print MAIL

El motivo de las líneas de salida duplicadas es que la declaración impresa esafuerala declaración condicional, y por lo tanto se ejecuta paracadalínea de entrada, en lugar de solo líneas que coincidan con la expresión regular. Además, dado que la mailvariable solo se establece dentro de la declaración condicional, el valor anterior se reutiliza una y otra vez hasta la próxima vez que una línea de entrada coincida con la declaración condicional.

¿Por qué awk imprime esta línea más de una vez?

Respuesta1

Respuesta2

información relacionada