¿Por qué cpu.cfs_quota_us no limita el ancho de banda de la CPU del contenedor LXC?

Question

Quería publicar la respuesta a esta pregunta en caso de que alguien más vea un resultado confuso similar. Parece que tuve dos problemas:

Es necesario utilizar el número de CPU en el host, no el número de CPU disponibles en el cpuset de cgroups para estimar el ancho de banda de la CPU:

(# of cpus on the host) * (cpu.cfs_period_us) * (.25) so 40 * 100000 * .25 = 1000000
Mi ejecución de estrés-ng dentro del contenedor estaba usando los controladores cpu y cpuset del grupo c /lxc/foo mientras que la ejecución de estrés-ng fuera del contenedor estaba usando el grupo c /system/sshd.service

Para modelar mejor mi aplicación del mundo real, debería haber especificado qué controladores usar usandocgexec:

$ cgexec -g cpuset:/lxc/foo -g cpu:/lxc/foo ./stress-ng --cpu-load 100 -c 48 --times --timeout 10s --metrics-brief  
stress-ng: info: [6252] dispatching hogs: 48 cpu  
stress-ng: info: [6252] successful run completed in 10.36s  
stress-ng: info: [6252] stressor      bogo ops real time  usr time  sys time   bogo ops/s   bogo ops/s  
stress-ng: info: [6252]                          (secs)    (secs)    (secs)   (real time) (usr+sys time)  
stress-ng: info: [6252] cpu              11152     10.09    102.83      0.12      1105.60       108.32  
stress-ng: info: [6252] for a 10.36s run time:  
stress-ng: info: [6252]     414.46s available CPU time  
stress-ng: info: [6252]     102.85s user time   ( 24.82%)  
stress-ng: info: [6252]       0.12s system time (  0.03%)  
stress-ng: info: [6252]     102.97s total time  ( 24.84%)

Answer 1

Quería publicar la respuesta a esta pregunta en caso de que alguien más vea un resultado confuso similar. Parece que tuve dos problemas:

Es necesario utilizar el número de CPU en el host, no el número de CPU disponibles en el cpuset de cgroups para estimar el ancho de banda de la CPU:

(# of cpus on the host) * (cpu.cfs_period_us) * (.25) so 40 * 100000 * .25 = 1000000
Mi ejecución de estrés-ng dentro del contenedor estaba usando los controladores cpu y cpuset del grupo c /lxc/foo mientras que la ejecución de estrés-ng fuera del contenedor estaba usando el grupo c /system/sshd.service

Para modelar mejor mi aplicación del mundo real, debería haber especificado qué controladores usar usandocgexec:

$ cgexec -g cpuset:/lxc/foo -g cpu:/lxc/foo ./stress-ng --cpu-load 100 -c 48 --times --timeout 10s --metrics-brief  
stress-ng: info: [6252] dispatching hogs: 48 cpu  
stress-ng: info: [6252] successful run completed in 10.36s  
stress-ng: info: [6252] stressor      bogo ops real time  usr time  sys time   bogo ops/s   bogo ops/s  
stress-ng: info: [6252]                          (secs)    (secs)    (secs)   (real time) (usr+sys time)  
stress-ng: info: [6252] cpu              11152     10.09    102.83      0.12      1105.60       108.32  
stress-ng: info: [6252] for a 10.36s run time:  
stress-ng: info: [6252]     414.46s available CPU time  
stress-ng: info: [6252]     102.85s user time   ( 24.82%)  
stress-ng: info: [6252]       0.12s system time (  0.03%)  
stress-ng: info: [6252]     102.97s total time  ( 24.84%)

¿Por qué cpu.cfs_quota_us no limita el ancho de banda de la CPU del contenedor LXC?

Respuesta1

información relacionada