Comando Bash para contar líneas con subcadenas coincidentes en dos posiciones diferentes

Question

En esencia, se puede hacer con

sed -r -n 's/(^.*)(delimiter 1)(.*)(delimiter 2)(.*)(delimiter 3)(.+$)/\1(delimiter)\5/p' <( command that generates debug logs ) | sort | uniq -c | sort -rn

(adaptado deaquí)

.*puede coincidir demasiado; sedes codicioso y quiere hacer coincidir tanto como sea posible lo antes posible, por lo que es posible que deban ser, por ejemplo, negaciones de los delimitadores (lo que puede ser complicado si tiene delimitadores inconvenientes)
Pasar de ^a $es importante; si su expresión no coincide, toda la línea sedincluirá la parte no coincidente en la salida.
Los paréntesis sólo son necesarios alrededor del nombre de la clase y del método; eliminar los demás significa cambiar los números al final, porque los números se refieren a subexpresiones entre paréntesis en orden. (Incluirlos a todos hace posible mostrar más de lo que sucede en la sedsalida, por ejemplo, cambiando el final a /\1(delimiter)\5 -- \1\2\3\4\5\6\7/p)
sortdebe ejecutarse antes uniq -cporque uniq -csolo cuenta las ejecuciones de líneas idénticas consecutivas, las líneas idénticas no consecutivas obtienen recuentos separados
uniq -cno se puede reemplazar sort -uporque sort -usolo descarta duplicados, no los cuenta
El final sortno es necesario para responder la pregunta tal como se hizo.
Sí, si usas expresiones regulares para resolver un problema, ahora tienes dos problemas.

Answer 1

En esencia, se puede hacer con

sed -r -n 's/(^.*)(delimiter 1)(.*)(delimiter 2)(.*)(delimiter 3)(.+$)/\1(delimiter)\5/p' <( command that generates debug logs ) | sort | uniq -c | sort -rn

(adaptado deaquí)

.*puede coincidir demasiado; sedes codicioso y quiere hacer coincidir tanto como sea posible lo antes posible, por lo que es posible que deban ser, por ejemplo, negaciones de los delimitadores (lo que puede ser complicado si tiene delimitadores inconvenientes)
Pasar de ^a $es importante; si su expresión no coincide, toda la línea sedincluirá la parte no coincidente en la salida.
Los paréntesis sólo son necesarios alrededor del nombre de la clase y del método; eliminar los demás significa cambiar los números al final, porque los números se refieren a subexpresiones entre paréntesis en orden. (Incluirlos a todos hace posible mostrar más de lo que sucede en la sedsalida, por ejemplo, cambiando el final a /\1(delimiter)\5 -- \1\2\3\4\5\6\7/p)
sortdebe ejecutarse antes uniq -cporque uniq -csolo cuenta las ejecuciones de líneas idénticas consecutivas, las líneas idénticas no consecutivas obtienen recuentos separados
uniq -cno se puede reemplazar sort -uporque sort -usolo descarta duplicados, no los cuenta
El final sortno es necesario para responder la pregunta tal como se hizo.
Sí, si usas expresiones regulares para resolver un problema, ahora tienes dos problemas.

Comando Bash para contar líneas con subcadenas coincidentes en dos posiciones diferentes

Respuesta1

información relacionada