у меня естьIntel Xeon D-1520Процессор
Я пытался бежатьIntel PCMчтобы получить коэффициент промахов и попаданий в кэш L3.
L3MISS: L3 cache misses
L3HIT : L3 cache hit ratio (0.00-1.00)
Core (SKT) | EXEC | IPC | FREQ | AFREQ | L3MISS | L2MISS | L3HIT | L2HIT | L3MPI | L2MPI | L3OCC | LMB | RMB | TEMP
0 0 0.02 1.06 0.02 0.37 411 K 489 K 0.16 0.05 0.01 0.01 176 16 0 58
1 0 0.05 0.38 0.13 0.60 3823 K 4508 K 0.15 0.16 0.04 0.04 4048 95 0 58
2 0 0.03 1.01 0.03 0.40 524 K 601 K 0.13 0.09 0.01 0.01 0 20 0 58
3 0 0.05 0.87 0.06 0.42 1758 K 2033 K 0.14 0.13 0.02 0.02 1776 63 0 58
4 0 0.02 1.24 0.02 0.37 196 K 247 K 0.21 0.06 0.00 0.00 16 13 0 58
5 0 0.09 0.88 0.10 0.66 2270 K 2565 K 0.11 0.12 0.01 0.01 128 99 0 58
6 0 0.03 1.27 0.02 0.40 218 K 273 K 0.20 0.05 0.00 0.00 32 14 0 58
7 0 0.03 1.43 0.02 0.40 221 K 279 K 0.21 0.04 0.00 0.00 160 16 0 58
---------------------------------------------------------------------------------------------------------------
SKT 0 0.04 0.80 0.05 0.51 9425 K 10 M 0.14 0.13 0.01 0.02 6336 336 0 58
---------------------------------------------------------------------------------------------------------------
TOTAL * 0.04 0.80 0.05 0.51 9425 K 10 M 0.14 0.13 0.01 0.02 N/A N/A N/A N/A
1.
Всегда ли низкий показатель попадания L3? Из показанных выше значений большинство из этих значений ниже 20%. Это нормально?
решение1
Я новичок в Intel PCM, пытаюсь измерить значение промаха L3.
Где-то я читал (может быть, на форуме Intel, я полагаю), что возможно иметь10% -15%низкое значение оригинала по общесистемной статистике по многим причинам. Поверьте, что вы используете ОС Windows.
В случае Linux, попробуйте вывести использование команды perf в make-файле. В моем тесте на Linux значение кэша L3 немного выше в нормальных условиях [т.е. не сильно загружен мой ноутбук i7 (7-го поколения)].
Вместо PCM, PCM-Core также полезен для запроса определенного значения счетчика. Например, в системе Windows можно использовать следующую команду, чтобы узнать MEM_LOAD_UOPS_RETIRED_L3_MISS
значение ./pcm-core.x 1.0 -e cpu/umask=0x20,event=0xD1
. 1.0 - для каждой секунды, Umask и значение события из спецификации вашего процессора (Intel). (Не могу вспомнить точное имя файла). Вывод должен быть таким1. Первый запрос = событие 0. Можно запросить до 3 событий.