我想討論一下我們的 rhel 7.6 伺服器上的奇怪行為
我們在伺服器 kafka-01 機器上安裝了帶有容器的 Kafka 導出器(機器上的總 CPU 為 12 )
以下yml
文件描述了 Kafka 匯出器容器配置
more docker.kafka-exporter.yml
---
version: '2.4'
services:
kafka-exporter:
mem_limit: "612m"
image: kafka-exporter:v1.2.0
restart: always
network_mode: host
container_name: kafka-exporter
command: ["--kafka.server=kafka01.sys65.com:6667"]ump
ports:
- 9308:9308
logging:
driver: "json-file"
options:
max-size: "15m"
max-file: "1"
所以當我們用 啟動容器時dockr-compose
,如docker-compose -f docker.kafka-exporter.yml up -d
我們注意到 CPU 平均負載在 1-2 小時後從~2-3
到跳躍30-40
並且只有重新啟動機器才能將正常的 CPU 平均負載恢復到正常(左右1 - 2
),但是每次啟動 docker compose 時 CPU 都會再次跳躍(即使停止 docker compose 也不會降低 CPU 平均負載)
有人可以暗示這種奇怪行為的原因是什麼嗎?
關於我們的案例,考慮安裝是否有用https://github.com/draios/sysdig,進行調查?
筆記:
uptime
我們透過linux 指令驗證了 CPU 負載 avrg
有時機器變成凍結或者懸掛所以我們無法存取機器,只有重新啟動才能使機器恢復正常