Linux 페이지 캐시로 인해 64GB RAM이 있는 듀얼 CPU 서버에서 IO 속도가 느려집니다.

Question

보고 있는 동작은 Linux가 NUMA 시스템에서 메모리를 할당하는 방식으로 인해 발생합니다.

나는 32GB 시스템이 Numa가 아니거나 Linux가 관리할 만큼 Numa가 아니라고 가정합니다.

Numa를 처리하는 방법은 옵션에 따라 결정됩니다 /proc/sys/vm/zone_reclaim_mode. 기본적으로 Linux는 Numa 시스템을 사용하고 있는지 감지하고 더 나은 성능을 제공할 것이라고 판단되면 회수 플래그를 변경합니다.

메모리는 여러 영역으로 나누어져 있으며, Numa 시스템에는 첫 번째 CPU 소켓을 위한 영역과 두 번째 CPU 소켓을 위한 영역이 있습니다. 이것들은 node0및 로 나타납니다 node1. 고양이를 키우면 볼 수 있습니다 /proc/buddyinfo.

영역 회수 모드가 1로 설정되면 첫 번째 CPU 소켓의 할당으로 인해 해당 CPU와 연결된 메모리 영역에서 회수가 발생합니다. 이는 로컬 Numa 노드에서 회수하는 것이 성능 측면에서 더 효율적이기 때문입니다. 이러한 의미에서 회수는 캐시를 지우거나 해당 노드에서 항목을 교체하는 등 페이지를 삭제하는 것입니다.

값을 0으로 설정하면 영역이 채워지는 경우 회수가 발생하지 않고 대신 메모리에 대한 외부 Numa 영역에 할당됩니다. 이는 해당 메모리 영역에 대한 독점 액세스를 얻기 위해 다른 CPU를 잠시 잠그는 대가로 발생합니다.

하지만 즉시 교환이 시작됩니다! 몇 초 후: 메모리: 총 66004536k, 사용된 65733796k, 사용 가능한 270740k, 버퍼 34250384k 스왑: 총 10239992k, 사용된 1178820k, 사용 가능한 9061172k, 캐시된 91388k

스와핑 동작과 스와핑 시기는 몇 가지 요소에 의해 결정됩니다. 그 중 하나는 애플리케이션에 할당된 페이지의 활성 정도입니다. 활동량이 많지 않은 경우 캐시에서 발생하는 더 바쁜 작업을 위해 교체됩니다. VM의 페이지가 자주 활성화되지 않는다고 가정합니다.

Answer 1