¿Cómo buscar un archivo por grupo de líneas y luego eliminar esas líneas?

Question

En realidad, no es tan difícil, siempre que todos los grupos tengan M líneas de largo, M sea fijo, los grupos no se superpongan y no necesitemos buscar el comienzo de ningún grupo. En nuestro caso M es 6.

sedle permite comparar varias líneas, pero como normalmente procesa una línea a la vez, necesita agregar explícitamente líneas adicionales al espacio del patrón. Lo haces con N:

sed 'N;N;N;N;N; /12:30\n.*\n.*\ntest notification\nnotification\nnotify-send/d'

El resto es tu código sin ^anclajes $. Las anclas suelen asociarse con "el principio de la línea" y "el final de la línea" respectivamente; pero en sedrealidad son "... de la cuerda". Cuando sedse procesa una línea a la vez no hay diferencia. En nuestro caso definitivamente debemos recordar que las anclas son "... de la cuerda". Ponerlos en el medio no tiene sentido. No es que nunca igualarían nada. sedEn primer lugar, no los interpretaría como anclas, sino que los interpretaría como literales ^y $.

No hay necesidad de anclajes "... de línea" en el medio de una cuerda. Cualquier línea excepto la última termina justo antes de algún carácter de nueva línea; cualquier línea, excepto la primera, comienza justo después de algún carácter de nueva línea. Entonces es suficiente para igualar \n.

Tal vez intentaste usar anclajes para asegurarte de que .*(que es codicioso y puede coincidir con caracteres de nueva línea) no coincida con más de una línea. Incluso si ^actuaran $como anclas "... de la línea", .*seguirían siendo codiciosos. Considere esto: el espacio del patrón sednunca contiene un carácter de nueva línea después de la última línea*. En nuestro caso sabemos que hay como máximo seis líneas en el espacio del patrón; y usamos \nexactamente cinco veces. Esto garantiza que cada fragmento de la expresión regular solo pueda coincidir con cierta línea en un grupo.

Aún así, las anclas pueden ayudar. El comando anterior puede eliminar un clúster que termina en notify-send-whatever. $es la manera correcta de prevenir esto. No hay más tiempo que 12:30ese partidos 12:30; pero es diferente para 2:30, por lo que en general ^también puede ser útil. El comando mejorado:

sed 'N;N;N;N;N; /^12:30\n.*\n.*\ntest notification\nnotification\nnotify-send$/d'

* Esto no significa que nunca pueda haber un carácter de nueva línea al final del espacio del patrón. Un carácter de nueva línea al final indica que hay una línea justo después del carácter. Es la última línea y está vacía. Y no hay ningún carácter de nueva línea después, por lo que "nunca hay un carácter de nueva línea después de la última línea".

Answer 1

En realidad, no es tan difícil, siempre que todos los grupos tengan M líneas de largo, M sea fijo, los grupos no se superpongan y no necesitemos buscar el comienzo de ningún grupo. En nuestro caso M es 6.

sedle permite comparar varias líneas, pero como normalmente procesa una línea a la vez, necesita agregar explícitamente líneas adicionales al espacio del patrón. Lo haces con N:

sed 'N;N;N;N;N; /12:30\n.*\n.*\ntest notification\nnotification\nnotify-send/d'

El resto es tu código sin ^anclajes $. Las anclas suelen asociarse con "el principio de la línea" y "el final de la línea" respectivamente; pero en sedrealidad son "... de la cuerda". Cuando sedse procesa una línea a la vez no hay diferencia. En nuestro caso definitivamente debemos recordar que las anclas son "... de la cuerda". Ponerlos en el medio no tiene sentido. No es que nunca igualarían nada. sedEn primer lugar, no los interpretaría como anclas, sino que los interpretaría como literales ^y $.

No hay necesidad de anclajes "... de línea" en el medio de una cuerda. Cualquier línea excepto la última termina justo antes de algún carácter de nueva línea; cualquier línea, excepto la primera, comienza justo después de algún carácter de nueva línea. Entonces es suficiente para igualar \n.

Tal vez intentaste usar anclajes para asegurarte de que .*(que es codicioso y puede coincidir con caracteres de nueva línea) no coincida con más de una línea. Incluso si ^actuaran $como anclas "... de la línea", .*seguirían siendo codiciosos. Considere esto: el espacio del patrón sednunca contiene un carácter de nueva línea después de la última línea*. En nuestro caso sabemos que hay como máximo seis líneas en el espacio del patrón; y usamos \nexactamente cinco veces. Esto garantiza que cada fragmento de la expresión regular solo pueda coincidir con cierta línea en un grupo.

Aún así, las anclas pueden ayudar. El comando anterior puede eliminar un clúster que termina en notify-send-whatever. $es la manera correcta de prevenir esto. No hay más tiempo que 12:30ese partidos 12:30; pero es diferente para 2:30, por lo que en general ^también puede ser útil. El comando mejorado:

sed 'N;N;N;N;N; /^12:30\n.*\n.*\ntest notification\nnotification\nnotify-send$/d'

* Esto no significa que nunca pueda haber un carácter de nueva línea al final del espacio del patrón. Un carácter de nueva línea al final indica que hay una línea justo después del carácter. Es la última línea y está vacía. Y no hay ningún carácter de nueva línea después, por lo que "nunca hay un carácter de nueva línea después de la última línea".

¿Cómo buscar un archivo por grupo de líneas y luego eliminar esas líneas?

Respuesta1

información relacionada