Agregar varios archivos de registro en un directorio

Question

Ofrezco una solución que ahora he elegido por mí mismo. No es la respuesta que estaba buscando, pero parece navegar con la corriente. Todavía tengo curiosidad por saber si esto podría manejarse mediante algún comando común de Unix.

De todos modos, esto es lo que hice:

La forma común parece utilizar una herramienta llamadafluido, que le permite recopilar registros de varias fuentes y transportarlos a cualquier lugar que considere adecuado: una especie de ETL para registros.

Elegí enviar los registros al servidor syslog porque ya tenía uno ejecutándose, pero puedes elegir cualquiera de los complementos de salida desde aquí:Complementos de salida. También hay un gran conjunto de complementos adicionales:Todos los complementos

Paso 1

Obtenga una configuración de Fluentd que tenga instalado el complemento remoto_syslog. No viene con la imagen oficial de la ventana acoplable, pero puedes configurarla tú mismo.

FROM fluent/fluentd:v1.14.0-1.0
USER root

# https://github.com/fluent-plugins-nursery/fluent-plugin-remote_syslog
RUN fluent-gem install fluent-plugin-remote_syslog

USER fluent

Cree la imagen y envíela a su registro.

Paso 2

A continuación, configure un manifiesto de implementación de Fluentd con notificaciones de volumen de solo lectura para acceder a los registros del pod. Los archivos reales residen en /var/log/pods/* y /var/log/containers contiene en realidad enlaces simbólicos. Necesitamos archivos reales. Esos registros son propiedad del root en la máquina host y un usuario con fluidez no tendrá acceso para leerlos. Necesitamos establecer algunos contextos de seguridad. Para que todo funcione, he utilizado el grupo raíz para fsGroup. Siéntase libre de profundizar más y encontrar/comentar la solución más óptima para este tema de seguridad.

apiVersion: apps/v1
kind: Deployment
...
spec:
  ...
    spec:
      securityContext:
        fsGroup: 0
      volumes:
        - name: varlogpods-pv
          persistentVolumeClaim:
            claimName: pvc-var-log-pods
            ...
      containers:
        - name: fluentd
          image: your/fluentd-image

Vea mi manifiesto completo en esta esencia:implementación fluida

Paso 3

Antes de implementar, también debe configurar fluent.confy describir algunas reglas allí.

El mío está configurado para coincidir con una línea de registro como esta:

2022-04-26T20:05:00.847016854+03:00 stderr F time="2022-04-26 17:05:00" level=info msg="processing 3 records ..."

Para obtener más información, consulte el complemento de cola:cola

    <source>
      @type tail
      @id in_tail_container_logs
      path "/var/log/pods/default_cron-*/*/*.log"
      pos_file "/tmp/cron_.log.pos"
      read_from_head true
      tag cron
      <parse>
        @type regexp
        expression /^(?<logtime>[^ ]*) .* level=(?<level>[^ ]*) msg="(?<message>[^"]*)"$/ 
        time_key logtime
        time_format %FT%T.%N%:z
      </parse>
    </source>
    
    <match cron>
     @type remote_syslog
     host 172.16.3.10
     port 514
     protocol udp
     severity info
     program "fluentd"
     hostname "k3sserver"
     
     <buffer>
     </buffer>
     
     <format>
      @type single_value
      message_key message
     </format>
    </match>

Un atributo de configuración importante aquí es read_from_head trueel que lee los archivos de registro desde la parte superior. Es necesario para este escenario, dado que los registros del pod están rotando, queremos que Fluentd lea el registro del pod completo, no solo unas pocas líneas de actualización al final. Para un trabajo cron breve, el archivo de registro simplemente aparece y tail no informa ninguna línea inicial en él.

Etapa 4

Juega con la configuración e inténtalo, inténtalo de nuevo. No olvide reiniciar su implementación después de haber actualizado la configuración en configMap.

Algunos fragmentos del rastro de búsqueda:

Answer 1

Ofrezco una solución que ahora he elegido por mí mismo. No es la respuesta que estaba buscando, pero parece navegar con la corriente. Todavía tengo curiosidad por saber si esto podría manejarse mediante algún comando común de Unix.

De todos modos, esto es lo que hice:

La forma común parece utilizar una herramienta llamadafluido, que le permite recopilar registros de varias fuentes y transportarlos a cualquier lugar que considere adecuado: una especie de ETL para registros.

Elegí enviar los registros al servidor syslog porque ya tenía uno ejecutándose, pero puedes elegir cualquiera de los complementos de salida desde aquí:Complementos de salida. También hay un gran conjunto de complementos adicionales:Todos los complementos

Paso 1

Obtenga una configuración de Fluentd que tenga instalado el complemento remoto_syslog. No viene con la imagen oficial de la ventana acoplable, pero puedes configurarla tú mismo.

FROM fluent/fluentd:v1.14.0-1.0
USER root

# https://github.com/fluent-plugins-nursery/fluent-plugin-remote_syslog
RUN fluent-gem install fluent-plugin-remote_syslog

USER fluent

Cree la imagen y envíela a su registro.

Paso 2

A continuación, configure un manifiesto de implementación de Fluentd con notificaciones de volumen de solo lectura para acceder a los registros del pod. Los archivos reales residen en /var/log/pods/* y /var/log/containers contiene en realidad enlaces simbólicos. Necesitamos archivos reales. Esos registros son propiedad del root en la máquina host y un usuario con fluidez no tendrá acceso para leerlos. Necesitamos establecer algunos contextos de seguridad. Para que todo funcione, he utilizado el grupo raíz para fsGroup. Siéntase libre de profundizar más y encontrar/comentar la solución más óptima para este tema de seguridad.

apiVersion: apps/v1
kind: Deployment
...
spec:
  ...
    spec:
      securityContext:
        fsGroup: 0
      volumes:
        - name: varlogpods-pv
          persistentVolumeClaim:
            claimName: pvc-var-log-pods
            ...
      containers:
        - name: fluentd
          image: your/fluentd-image

Vea mi manifiesto completo en esta esencia:implementación fluida

Paso 3

Antes de implementar, también debe configurar fluent.confy describir algunas reglas allí.

El mío está configurado para coincidir con una línea de registro como esta:

2022-04-26T20:05:00.847016854+03:00 stderr F time="2022-04-26 17:05:00" level=info msg="processing 3 records ..."

Para obtener más información, consulte el complemento de cola:cola

    <source>
      @type tail
      @id in_tail_container_logs
      path "/var/log/pods/default_cron-*/*/*.log"
      pos_file "/tmp/cron_.log.pos"
      read_from_head true
      tag cron
      <parse>
        @type regexp
        expression /^(?<logtime>[^ ]*) .* level=(?<level>[^ ]*) msg="(?<message>[^"]*)"$/ 
        time_key logtime
        time_format %FT%T.%N%:z
      </parse>
    </source>
    
    <match cron>
     @type remote_syslog
     host 172.16.3.10
     port 514
     protocol udp
     severity info
     program "fluentd"
     hostname "k3sserver"
     
     <buffer>
     </buffer>
     
     <format>
      @type single_value
      message_key message
     </format>
    </match>

Un atributo de configuración importante aquí es read_from_head trueel que lee los archivos de registro desde la parte superior. Es necesario para este escenario, dado que los registros del pod están rotando, queremos que Fluentd lea el registro del pod completo, no solo unas pocas líneas de actualización al final. Para un trabajo cron breve, el archivo de registro simplemente aparece y tail no informa ninguna línea inicial en él.

Etapa 4

Juega con la configuración e inténtalo, inténtalo de nuevo. No olvide reiniciar su implementación después de haber actualizado la configuración en configMap.

Agregar varios archivos de registro en un directorio

Respuesta1

Paso 1

Paso 2

Paso 3

Etapa 4

Algunos fragmentos del rastro de búsqueda:

información relacionada