
Tenemos un problema de optimización del sistema que requiere un flujo de trabajo claro de ejecución de una CPU. ¿Cómo ejecuta una CPU moderna (por ejemplo, Intel Xeon) con múltiples niveles de caché un programa originalmente almacenado en el disco duro de una computadora?
Sé que, a grandes rasgos, el programa primero se carga en la memoria y luego la CPU decodifica las instrucciones y obtiene los datos necesarios de la memoria. Pero, ¿cuál es el flujo de trabajo detallado de una CPU que carga instrucciones desde DRAM con todos los niveles posibles de cachés involucrados (tal vez desde DRAM a la caché L3, caché L2 y caché de instrucciones L1 o directamente desde DRAM a la caché de instrucciones L1), y el Flujo de trabajo detallado de datos de carga de CPU (¿desde DRAM hasta L3->L2->L1D?).