
Wir haben ein Systemoptimierungsproblem, das einen klaren Arbeitsablauf der Ausführung einer CPU erfordert. Wie führt eine moderne CPU (z. B. Intel Xeon) mit mehreren Cache-Ebenen ein Programm aus, das ursprünglich auf einer Festplatte eines Computers gespeichert war?
Ich weiß ungefähr, dass das Programm zuerst in den Speicher geladen wird und die CPU dann die Anweisungen dekodiert und die benötigten Daten aus dem Speicher holt. Aber wie sieht der detaillierte Arbeitsablauf einer CPU aus, die Anweisungen aus dem DRAM lädt, wobei alle möglichen Cache-Ebenen beteiligt sind (vielleicht vom DRAM zum L3-Cache, L2-Cache und L1-Anweisungscache oder direkt vom DRAM zum L1-Anweisungscache) und wie der detaillierte Arbeitsablauf der CPU aussieht, wenn sie Daten lädt (vom DRAM zum L3->L2->L1D?).