
У нас есть проблема оптимизации системы, которая требует четкого рабочего процесса выполнения ЦП. Как современный ЦП (например, Intel Xeon) с несколькими уровнями кэша выполняет программу, изначально сохраненную на жестком диске компьютера?
Я знаю, что программа сначала загружается в память, а затем ЦП декодирует инструкции и получает необходимые данные из памяти. Но каков подробный рабочий процесс загрузки ЦП инструкций из DRAM со всеми возможными уровнями задействованных кэшей (возможно, из DRAM в кэш L3, кэш L2 и кэш инструкций L1 или напрямую из DRAM в кэш инструкций L1), и подробный рабочий процесс загрузки ЦП данных (из DRAM в L3->L2->L1D?).