O cache L3 é compartilhado por todos os núcleos de uma CPU Sandy-Bridge E Xeon?

Question 1

Nessas CPUs, cada núcleo físico possui seu próprio cache L2. O cache L3 é compartilhado por todos os núcleos e é inclusivo – ou seja, quaisquer dados que residam no cache L2 de qualquer núcleo também residem no cache L3.

Embora isso possa parecer um desperdício de espaço L3, na verdade torna o L3 inestimável para acelerar operações de memória entre núcleos. O objetivo principal do cache L3 é atuar como painel de controle e área de preparação para os núcleos. Por exemplo, se um núcleo quiser saber se uma região da memória pode ser armazenada em cache por outro núcleo, ele poderá verificar o cache L3. Se as informações foram processadas por um núcleo e em seguida precisam ser processadas por outro núcleo, elas são transmitidas por meio do cache L3, em vez da memória mais lenta fora do chip. Além disso, seu impacto no desempenho não é muito grande, exceto por algoritmos incomuns – o cache L2 é grande o suficiente para coisas pequenas e o cache L3 é pequeno demais para coisas grandes.

Portanto, embora cada núcleo tenha seu próprio cache L2 de 256 KB e efetivamente 256 KB reservados no cache L3, o equilíbrio é compartilhado por todos os núcleos. Atividades menos importantes em outros núcleos podem prejudicar o desempenho de uma tarefa mais importante que se beneficia do uso do espaço L3. Mas pelas razões que mencionei, geralmente não é um efeito significativo na prática e geralmente não vale a pena se preocupar além da otimização de operações de "dados em massa" (como compactação e varredura) para minimizar a poluição do cache. (Por exemplo, usando operações não temporais.)

Answer

Nessas CPUs, cada núcleo físico possui seu próprio cache L2. O cache L3 é compartilhado por todos os núcleos e é inclusivo – ou seja, quaisquer dados que residam no cache L2 de qualquer núcleo também residem no cache L3.

Embora isso possa parecer um desperdício de espaço L3, na verdade torna o L3 inestimável para acelerar operações de memória entre núcleos. O objetivo principal do cache L3 é atuar como painel de controle e área de preparação para os núcleos. Por exemplo, se um núcleo quiser saber se uma região da memória pode ser armazenada em cache por outro núcleo, ele poderá verificar o cache L3. Se as informações foram processadas por um núcleo e em seguida precisam ser processadas por outro núcleo, elas são transmitidas por meio do cache L3, em vez da memória mais lenta fora do chip. Além disso, seu impacto no desempenho não é muito grande, exceto por algoritmos incomuns – o cache L2 é grande o suficiente para coisas pequenas e o cache L3 é pequeno demais para coisas grandes.

Portanto, embora cada núcleo tenha seu próprio cache L2 de 256 KB e efetivamente 256 KB reservados no cache L3, o equilíbrio é compartilhado por todos os núcleos. Atividades menos importantes em outros núcleos podem prejudicar o desempenho de uma tarefa mais importante que se beneficia do uso do espaço L3. Mas pelas razões que mencionei, geralmente não é um efeito significativo na prática e geralmente não vale a pena se preocupar além da otimização de operações de "dados em massa" (como compactação e varredura) para minimizar a poluição do cache. (Por exemplo, usando operações não temporais.)

Question 2

Entendo que todos os níveis de cache são implementados diretamente no chip e que L2 e L3 são iguais (que apenas a Intel reconhece a diferença, a AMD os combina). Com isso em mente, imagino que o cache L3 nas CPUs não seja compartilhado entre as CPUs em uma placa-mãe com soquete duplo. Isso também faz sentido, tendo em mente que é comum ver canais de memória separados para RAM por CPU.

Alguém me corrija se eu estiver errado.

Answer

Entendo que todos os níveis de cache são implementados diretamente no chip e que L2 e L3 são iguais (que apenas a Intel reconhece a diferença, a AMD os combina). Com isso em mente, imagino que o cache L3 nas CPUs não seja compartilhado entre as CPUs em uma placa-mãe com soquete duplo. Isso também faz sentido, tendo em mente que é comum ver canais de memória separados para RAM por CPU.

Alguém me corrija se eu estiver errado.

O cache L3 é compartilhado por todos os núcleos de uma CPU Sandy-Bridge E Xeon?

Responder1

Responder2

informação relacionada