これはプロセスを監視するのに適したツールだとわかりましたpidstat
。特定のプロセスの平均メモリ使用量を計算したいのですが、出力例を以下に示します。
02:34:36 PM PID minflt/s majflt/s VSZ RSS %MEM Command
02:34:37 PM 7276 2.00 0.00 349212 210176 7.14 scalpel
(これは からの出力の一部ですpidstat -r -p 7276
。)
平均メモリ消費量を計算するには、常駐セット サイズ (RSS) 情報と仮想サイズ (VSZ) 情報のどちらを使用すればよいでしょうか? Wikipedia やフォーラムでいくつか読みましたが、違いを完全に理解できているかどうかはわかりません。また、どれも信頼できないようです。では、プロセスを監視してメモリ使用量を取得するにはどうすればよいでしょうか?
この件に関してどんな助言でもいただければ助かります。
答え1
RSS は、このプロセスが現在メイン メモリ (RAM) 内に保持しているメモリの量です。VSZ は、プロセスが保持している仮想メモリの合計量です。これには、RAM 内とスワップ アウトされたすべての種類のメモリが含まれます。これらの数値は、共有ライブラリやその他の種類のメモリも含まれるため、歪む可能性があります。インスタンスを 500 個bash
実行していても、メモリ フットプリントの合計サイズは RSS 値または VSZ 値の合計にはなりません。
プロセスのメモリ フットプリントについてより詳細な情報を取得する必要がある場合は、いくつかのオプションがあります。/proc/$PID/map
不要なものを調べて除去することができます。 共有ライブラリの場合は、ニーズに応じて計算が複雑になる可能性があります (そう覚えていると思います)。
プロセスのヒープサイズだけを気にするのであれば、ファイル[heap]
内のエントリを解析するだけでよいmap
。カーネルがプロセスヒープに割り当てたサイズは、プロセスが持つ正確なバイト数を反映しているかどうかはわからない。尋ねた割り当てられるサイズです。細かい点、カーネル内部、最適化などにより、このサイズがずれることがあります。理想的な状況では、プロセスが必要とするサイズが、システム ページ サイズの最も近い倍数に切り上げられます ( がgetconf PAGESIZE
サイズを教えてくれます。PC では、おそらく 4,096 バイトです)。
プロセスがどれだけのメモリを持っているかを確認したい場合割り当てられた最も良い方法の 1 つは、カーネル側のメトリックを放棄することです。代わりに、メカニズムを使用して C ライブラリのヒープ メモリの割り当て (解除) 関数を計測しますLD_PRELOAD
。個人的には、この種の情報を取得するために少し乱用していますvalgrind
。(計測を適用するには、プロセスを再起動する必要があることに注意してください。)
実行時間のベンチマークも行う可能性があるため、valgrind
プログラムがわずかに遅くなることに注意してください (ただし、おそらく許容範囲内です)。
答え2
最小限の実行可能な例
これを理解するには、ページングの基本を理解する必要があります。https://stackoverflow.com/questions/18431261/how-does-x86-paging-work特に、OS は、RAM またはディスク (RSS 常駐メモリ) 上に実際にバックアップ ストレージが存在する前に、ページ テーブルまたは内部メモリ ブック キーピング (VSZ 仮想メモリ) を介して仮想メモリを割り当てることができます。
これを実際に観察するために、次のようなプログラムを作成しましょう。
- 物理メモリよりも多くのRAMを割り当てます
mmap
- 各ページに1バイトを書き込み、各ページが仮想専用メモリ(VSZ)から実際に使用されるメモリ(RSS)に移動することを保証します。
- 次のいずれかの方法でプロセスのメモリ使用量を確認します。https://stackoverflow.com/questions/1558402/c での現在のプロセスのメモリ使用量
メイン.c
#define _GNU_SOURCE
#include <assert.h>
#include <inttypes.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/mman.h>
#include <unistd.h>
typedef struct {
unsigned long size,resident,share,text,lib,data,dt;
} ProcStatm;
/* https://stackoverflow.com/questions/1558402/memory-usage-of-current-process-in-c/7212248#7212248 */
void ProcStat_init(ProcStatm *result) {
const char* statm_path = "/proc/self/statm";
FILE *f = fopen(statm_path, "r");
if(!f) {
perror(statm_path);
abort();
}
if(7 != fscanf(
f,
"%lu %lu %lu %lu %lu %lu %lu",
&(result->size),
&(result->resident),
&(result->share),
&(result->text),
&(result->lib),
&(result->data),
&(result->dt)
)) {
perror(statm_path);
abort();
}
fclose(f);
}
int main(int argc, char **argv) {
ProcStatm proc_statm;
char *base, *p;
char system_cmd[1024];
long page_size;
size_t i, nbytes, print_interval, bytes_since_last_print;
int snprintf_return;
/* Decide how many ints to allocate. */
if (argc < 2) {
nbytes = 0x10000;
} else {
nbytes = strtoull(argv[1], NULL, 0);
}
if (argc < 3) {
print_interval = 0x1000;
} else {
print_interval = strtoull(argv[2], NULL, 0);
}
page_size = sysconf(_SC_PAGESIZE);
/* Allocate the memory. */
base = mmap(
NULL,
nbytes,
PROT_READ | PROT_WRITE,
MAP_SHARED | MAP_ANONYMOUS,
-1,
0
);
if (base == MAP_FAILED) {
perror("mmap");
exit(EXIT_FAILURE);
}
/* Write to all the allocated pages. */
i = 0;
p = base;
bytes_since_last_print = 0;
/* Produce the ps command that lists only our VSZ and RSS. */
snprintf_return = snprintf(
system_cmd,
sizeof(system_cmd),
"ps -o pid,vsz,rss | awk '{if (NR == 1 || $1 == \"%ju\") print}'",
(uintmax_t)getpid()
);
assert(snprintf_return >= 0);
assert((size_t)snprintf_return < sizeof(system_cmd));
bytes_since_last_print = print_interval;
do {
/* Modify a byte in the page. */
*p = i;
p += page_size;
bytes_since_last_print += page_size;
/* Print process memory usage every print_interval bytes.
* We count memory using a few techniques from:
* https://stackoverflow.com/questions/1558402/memory-usage-of-current-process-in-c */
if (bytes_since_last_print > print_interval) {
bytes_since_last_print -= print_interval;
printf("extra_memory_committed %lu KiB\n", (i * page_size) / 1024);
ProcStat_init(&proc_statm);
/* Check /proc/self/statm */
printf(
"/proc/self/statm size resident %lu %lu KiB\n",
(proc_statm.size * page_size) / 1024,
(proc_statm.resident * page_size) / 1024
);
/* Check ps. */
puts(system_cmd);
system(system_cmd);
puts("");
}
i++;
} while (p < base + nbytes);
/* Cleanup. */
munmap(base, nbytes);
return EXIT_SUCCESS;
}
コンパイルして実行します:
gcc -ggdb3 -O0 -std=c99 -Wall -Wextra -pedantic -o main.out main.c
echo 1 | sudo tee /proc/sys/vm/overcommit_memory
sudo dmesg -c
./main.out 0x1000000000 0x200000000
echo $?
sudo dmesg
どこ:
- 0x1000000000 == 64GiB: コンピュータの物理RAM 32GiBの2倍
- 0x200000000 == 8GiB: 8GiBごとにメモリを印刷するので、クラッシュする前に約32GiBで4回の印刷が行われるはずです。
echo 1 | sudo tee /proc/sys/vm/overcommit_memory
: Linux で物理 RAM より大きい mmap 呼び出しを可能にするために必要です。https://stackoverflow.com/questions/2798330/maximum-memory-which-malloc-can-allocate/57687432#57687432
プログラム出力:
extra_memory_committed 0 KiB
/proc/self/statm size resident 67111332 768 KiB
ps -o pid,vsz,rss | awk '{if (NR == 1 || $1 == "29827") print}'
PID VSZ RSS
29827 67111332 1648
extra_memory_committed 8388608 KiB
/proc/self/statm size resident 67111332 8390244 KiB
ps -o pid,vsz,rss | awk '{if (NR == 1 || $1 == "29827") print}'
PID VSZ RSS
29827 67111332 8390256
extra_memory_committed 16777216 KiB
/proc/self/statm size resident 67111332 16778852 KiB
ps -o pid,vsz,rss | awk '{if (NR == 1 || $1 == "29827") print}'
PID VSZ RSS
29827 67111332 16778864
extra_memory_committed 25165824 KiB
/proc/self/statm size resident 67111332 25167460 KiB
ps -o pid,vsz,rss | awk '{if (NR == 1 || $1 == "29827") print}'
PID VSZ RSS
29827 67111332 25167472
Killed
終了ステータス:
137
それは128 + 信号番号ルール信号番号を取得しました9
。これman 7 signal
はシグナルキルLinuxから送信されるメモリ不足キラー。
出力の解釈:
- VSZ 仮想メモリは、mmap 後も一定のままです
printf '0x%X\n' 0x40009A4 KiB ~= 64GiB
(値は KiB 単位)。ps
- RSS の「実メモリ使用量」は、ページにアクセスしたときにのみ徐々に増加します。例:
- 最初の印刷では、 があり
extra_memory_committed 0
、これはまだどのページにも触れていないことを意味します。 RSS は、1648 KiB
テキスト領域、グローバルなどの通常のプログラム起動用に割り当てられた小さな領域です。 - 2回目の印刷では、
8388608 KiB == 8GiB
ページ数に相当する書き込みを行いました。その結果、RSSはちょうど8GIB増加し、8390256 KiB == 8388608 KiB + 1648 KiB
- RSSは8GiBずつ増加し続けています。最後の出力では約24GiBのメモリが示されており、32GiBを出力する前にOOMキラーがプロセスを強制終了しました。
- 最初の印刷では、 があり
OOMキラーログ
私たちのdmesg
コマンドは OOM キラー ログを表示しました。
それらの正確な解釈については、以下で質問されています。
- https://stackoverflow.com/questions/9199731/understanding-the-linux-oom-killers-logsここで簡単に見てみましょう。
- https://serverfault.com/questions/548736/oom-killer-syslog-メッセージの読み方
ログの最初の行は次の通りです。
[ 7283.479087] mongod invoked oom-killer: gfp_mask=0x6200ca(GFP_HIGHUSER_MOVABLE), order=0, oom_score_adj=0
興味深いことに、最初に OOM キラーを引き起こしたのは、私のラップトップでバックグラウンドで常に実行されている MongoDB デーモンであり、おそらくメモリを割り当てようとしたときに発生したと考えられます。
しかし、OOM キラーは必ずしもそれを起こした人を殺すわけではありません。
呼び出し後、カーネルは次のものを含むテーブルまたはプロセスを出力しますoom_score
。
[ 7283.479292] [ pid ] uid tgid total_vm rss pgtables_bytes swapents oom_score_adj name
[ 7283.479303] [ 496] 0 496 16126 6 172032 484 0 systemd-journal
[ 7283.479306] [ 505] 0 505 1309 0 45056 52 0 blkmapd
[ 7283.479309] [ 513] 0 513 19757 0 57344 55 0 lvmetad
[ 7283.479312] [ 516] 0 516 4681 1 61440 444 -1000 systemd-udevd
さらに先に進むと、main.out
前の呼び出しで実際に私たち自身の little が殺されたことがわかります。
[ 7283.479871] Out of memory: Kill process 15665 (main.out) score 865 or sacrifice child
[ 7283.479879] Killed process 15665 (main.out) total-vm:67111332kB, anon-rss:92kB, file-rss:4kB, shmem-rss:30080832kB
[ 7283.479951] oom_reaper: reaped process 15665 (main.out), now anon-rss:0kB, file-rss:0kB, shmem-rss:30080832kB
このログには、score 865
そのプロセスが持っていた、おそらく最高 (最悪) の OOM キラー スコアが次のように記載されています。OOM キラーは、どのプロセスを最初に終了するかをどのように決定するのでしょうか?
また興味深いことに、すべてが非常に速く起こったため、解放されたメモリが計算される前に、プロセスoom
によって再び起動されましたDeadlineMonitor
。
[ 7283.481043] DeadlineMonitor invoked oom-killer: gfp_mask=0x6200ca(GFP_HIGHUSER_MOVABLE), order=0, oom_score_adj=0
そして今回は、私のコンピュータで通常メモリを大量に消費する Chromium プロセスをいくつか終了しました。
[ 7283.481773] Out of memory: Kill process 11786 (chromium-browse) score 306 or sacrifice child
[ 7283.481833] Killed process 11786 (chromium-browse) total-vm:1813576kB, anon-rss:208804kB, file-rss:0kB, shmem-rss:8380kB
[ 7283.497847] oom_reaper: reaped process 11786 (chromium-browse), now anon-rss:0kB, file-rss:0kB, shmem-rss:8044kB
Ubuntu 19.04、Linux カーネル 5.0.0 でテスト済み。