¿La caché L3 es compartida por todos los núcleos de una CPU Sandy-Bridge E Xeon?

Question 1

En estas CPU, cada núcleo físico tiene su propia caché L2. La caché L3 es compartida por todos los núcleos y es inclusiva; es decir, cualquier dato que resida en la caché L2 de cualquier núcleo también reside en la caché L3.

Si bien esto puede parecer un desperdicio de espacio L3, en realidad hace que L3 sea invaluable para acelerar las operaciones de memoria entre núcleos. El objetivo principal de la caché L3 es actuar como centralita y área de preparación para los núcleos. Por ejemplo, si un núcleo quiere saber si otro núcleo puede almacenar en caché una región de la memoria, puede verificar el caché L3. Si la información fue procesada por un núcleo y el siguiente necesita ser procesado por otro núcleo, la transfieren a través del caché L3 en lugar de la memoria fuera del chip, que es más lenta. Más allá de eso, su impacto en el rendimiento no es mucho, excepto por algoritmos inusuales: el caché L2 es lo suficientemente grande para cosas pequeñas y el caché L3 es demasiado pequeño para cosas grandes.

Entonces, si bien cada núcleo tiene su propia caché L2 de 256 KB y efectivamente 256 KB reservados en la caché L3, el resto lo comparten todos los núcleos. Una actividad menos importante en otros núcleos puede perjudicar el desempeño de una tarea más importante que se beneficia del uso del espacio L3. Pero por las razones que mencioné, generalmente no es un efecto significativo en la práctica y generalmente no vale la pena preocuparse más allá de optimizar las operaciones de "datos masivos" (como la compresión y el escaneo) para minimizar la contaminación de la caché. (Por ejemplo, utilizando operaciones no temporales).

Answer

En estas CPU, cada núcleo físico tiene su propia caché L2. La caché L3 es compartida por todos los núcleos y es inclusiva; es decir, cualquier dato que resida en la caché L2 de cualquier núcleo también reside en la caché L3.

Si bien esto puede parecer un desperdicio de espacio L3, en realidad hace que L3 sea invaluable para acelerar las operaciones de memoria entre núcleos. El objetivo principal de la caché L3 es actuar como centralita y área de preparación para los núcleos. Por ejemplo, si un núcleo quiere saber si otro núcleo puede almacenar en caché una región de la memoria, puede verificar el caché L3. Si la información fue procesada por un núcleo y el siguiente necesita ser procesado por otro núcleo, la transfieren a través del caché L3 en lugar de la memoria fuera del chip, que es más lenta. Más allá de eso, su impacto en el rendimiento no es mucho, excepto por algoritmos inusuales: el caché L2 es lo suficientemente grande para cosas pequeñas y el caché L3 es demasiado pequeño para cosas grandes.

Entonces, si bien cada núcleo tiene su propia caché L2 de 256 KB y efectivamente 256 KB reservados en la caché L3, el resto lo comparten todos los núcleos. Una actividad menos importante en otros núcleos puede perjudicar el desempeño de una tarea más importante que se beneficia del uso del espacio L3. Pero por las razones que mencioné, generalmente no es un efecto significativo en la práctica y generalmente no vale la pena preocuparse más allá de optimizar las operaciones de "datos masivos" (como la compresión y el escaneo) para minimizar la contaminación de la caché. (Por ejemplo, utilizando operaciones no temporales).

Question 2

Tengo entendido que todos los niveles de caché se implementan directamente en el chip y que L2 y L3 son iguales (que solo Intel reconoce la diferencia, AMD los combina). Con esto en mente, me imagino que la caché L3 de las CPU no se comparte entre las CPU de una placa base con doble conector. Esto también tiene sentido teniendo en cuenta que es típico ver canales de memoria separados para RAM por CPU.

Que alguien me corrija si me equivoco.

Answer

Tengo entendido que todos los niveles de caché se implementan directamente en el chip y que L2 y L3 son iguales (que solo Intel reconoce la diferencia, AMD los combina). Con esto en mente, me imagino que la caché L3 de las CPU no se comparte entre las CPU de una placa base con doble conector. Esto también tiene sentido teniendo en cuenta que es típico ver canales de memoria separados para RAM por CPU.

Que alguien me corrija si me equivoco.

¿La caché L3 es compartida por todos los núcleos de una CPU Sandy-Bridge E Xeon?

Respuesta1

Respuesta2

información relacionada