
CPU 実行の明確なワークフローを必要とするシステム最適化の問題があります。複数レベルのキャッシュを備えた最新の CPU (Intel Xeon など) は、コンピューターのハード ドライブに元々保存されているプログラムをどのように実行するのでしょうか。
大まかに言うと、プログラムはまずメモリにロードされ、次に CPU が命令をデコードしてメモリから必要なデータを取得します。しかし、すべての可能なレベルのキャッシュが関与する DRAM から命令をロードする CPU の詳細なワークフロー (おそらく DRAM から L3 キャッシュ、L2 キャッシュ、L1 命令キャッシュへ、または DRAM から直接 L1 命令キャッシュへ)、および CPU がデータをロードする詳細なワークフロー (DRAM から L3->L2->L1D へ) は何ですか。