느린 NFS 및 GFS2 성능

Question 1

몇 가지 일반적인 지침만 제공할 수 있습니다.

먼저 몇 가지 간단한 벤치마크 지표를 준비하고 실행하겠습니다. 그러면 최소한 당신이 만든 변화가 최선인지 알게 될 것입니다.

무닌
선인장
나기오스

좋은 선택이군요.

이러한 노드는 가상 서버입니까 아니면 물리적 서버입니까? 사양은 무엇입니까?

각 노드 사이에는 어떤 종류의 네트워크 연결이 있습니까?

호스팅 제공업체의 개인 네트워크를 통해 NFS가 설정되어 있습니까?

방화벽으로 패킷/포트를 제한하지 않습니다. 호스팅 제공업체가 이를 수행하고 있습니까?

Answer

몇 가지 일반적인 지침만 제공할 수 있습니다.

먼저 몇 가지 간단한 벤치마크 지표를 준비하고 실행하겠습니다. 그러면 최소한 당신이 만든 변화가 최선인지 알게 될 것입니다.

무닌
선인장
나기오스

좋은 선택이군요.

이러한 노드는 가상 서버입니까 아니면 물리적 서버입니까? 사양은 무엇입니까?

각 노드 사이에는 어떤 종류의 네트워크 연결이 있습니까?

호스팅 제공업체의 개인 네트워크를 통해 NFS가 설정되어 있습니까?

방화벽으로 패킷/포트를 제한하지 않습니다. 호스팅 제공업체가 이를 수행하고 있습니까?

Question 2

두 가지 문제가 있다고 생각합니다. 우선 문제를 일으키는 병목 현상과 더 중요한 것은 GFS의 잘못된 오류 처리입니다. GFS는 실제로 작동할 때까지 전송 속도를 늦춰야 하지만 저는 이에 대해 도움을 드릴 수 없습니다.

클러스터가 NFS에서 ~200GB의 새 파일을 처리한다고 합니다. 클러스터에서 얼마나 많은 데이터를 읽고 있습니까?

프론트엔드와 백엔드에 하나의 네트워크 연결이 있으면 프론트엔드가 백엔드를 "직접" 중단할 수 있기 때문에(데이터 연결에 과부하가 걸려서) 항상 불안할 것입니다.

각 상자에 iperf를 설치하면 특정 지점에서 사용 가능한 네트워크 처리량을 테스트할 수 있습니다. 이는 네트워크 병목 현상이 있는지 확인하는 가장 빠른 방법일 수 있습니다.

네트워크는 얼마나 많이 활용되나요? 스토리지 서버의 디스크 속도는 얼마나 빠르며 어떤 RAID 설정을 사용하고 있습니까? 어떤 처리량을 얻습니까? *nix가 실행 중이고 테스트할 조용한 순간이 있다고 가정하면 hdparm을 사용할 수 있습니다.

$ hdpard -tT /dev/<device>

네트워크 사용량이 많은 경우 보조 및 전용 네트워크 연결에 GFS를 배치하는 것이 좋습니다.

12개 디스크를 어떻게 RAID(ed)했는지에 따라 성능 수준이 달라질 수 있으며 이것이 두 번째 병목 현상이 될 수 있습니다. 또한 하드웨어 RAID 또는 소프트웨어 RAID를 사용하는지 여부에 따라 달라집니다.

요청된 데이터가 총 메모리보다 더 많이 분산되어 있으면 상자에 있는 엄청난 양의 메모리가 거의 쓸모가 없을 수 있습니다. 게다가 메모리는 읽기에만 도움이 될 수 있으며 많은 읽기가 동일한 파일에 대한 경우에만 도움이 됩니다(그렇지 않으면 캐시에서 쫓겨날 수 있음).

top/htop을 실행할 때 iowait를 시청하세요. 여기서 높은 값은 CPU가 무언가(네트워크, 디스크 등)를 기다리며 손가락질을 하고 있다는 훌륭한 지표입니다.

제 생각에는 NFS가 범인이 될 가능성이 적습니다. 우리는 NFS에 대해 상당히 광범위한 경험을 갖고 있으며 조정/최적화할 수는 있지만경향꽤 안정적으로 작동합니다.

GFS 구성 요소를 안정적으로 만든 다음 NFS 관련 문제가 사라지는지 확인하고 싶습니다.

마지막으로 OCFS2는 GFS를 대체할 수 있는 옵션이 될 수 있습니다. 분산 파일 시스템에 대해 연구하는 동안 꽤 많은 연구를 했는데 왜 OCFS2를 선택했는지 기억이 나지 않습니다. 하지만 그렇게 했습니다. 아마도 이는 Oracle이 데이터베이스 백엔드에 사용하는 OCFS2와 관련이 있을 수 있으며 이는 매우 높은 안정성 요구 사항을 의미합니다.

무닌은 당신의 친구입니다. 그러나 훨씬 더 중요한 것은 top / htop입니다. vmstat는 또한 몇 가지 주요 번호를 제공할 수도 있습니다.

$ vmstat 1

시스템이 정확히 무엇을 하는 데 시간을 소비하는지 매초마다 업데이트를 받게 됩니다.

행운을 빌어요!

Answer

두 가지 문제가 있다고 생각합니다. 우선 문제를 일으키는 병목 현상과 더 중요한 것은 GFS의 잘못된 오류 처리입니다. GFS는 실제로 작동할 때까지 전송 속도를 늦춰야 하지만 저는 이에 대해 도움을 드릴 수 없습니다.

클러스터가 NFS에서 ~200GB의 새 파일을 처리한다고 합니다. 클러스터에서 얼마나 많은 데이터를 읽고 있습니까?

프론트엔드와 백엔드에 하나의 네트워크 연결이 있으면 프론트엔드가 백엔드를 "직접" 중단할 수 있기 때문에(데이터 연결에 과부하가 걸려서) 항상 불안할 것입니다.

각 상자에 iperf를 설치하면 특정 지점에서 사용 가능한 네트워크 처리량을 테스트할 수 있습니다. 이는 네트워크 병목 현상이 있는지 확인하는 가장 빠른 방법일 수 있습니다.

네트워크는 얼마나 많이 활용되나요? 스토리지 서버의 디스크 속도는 얼마나 빠르며 어떤 RAID 설정을 사용하고 있습니까? 어떤 처리량을 얻습니까? *nix가 실행 중이고 테스트할 조용한 순간이 있다고 가정하면 hdparm을 사용할 수 있습니다.

$ hdpard -tT /dev/<device>

네트워크 사용량이 많은 경우 보조 및 전용 네트워크 연결에 GFS를 배치하는 것이 좋습니다.

12개 디스크를 어떻게 RAID(ed)했는지에 따라 성능 수준이 달라질 수 있으며 이것이 두 번째 병목 현상이 될 수 있습니다. 또한 하드웨어 RAID 또는 소프트웨어 RAID를 사용하는지 여부에 따라 달라집니다.

요청된 데이터가 총 메모리보다 더 많이 분산되어 있으면 상자에 있는 엄청난 양의 메모리가 거의 쓸모가 없을 수 있습니다. 게다가 메모리는 읽기에만 도움이 될 수 있으며 많은 읽기가 동일한 파일에 대한 경우에만 도움이 됩니다(그렇지 않으면 캐시에서 쫓겨날 수 있음).

top/htop을 실행할 때 iowait를 시청하세요. 여기서 높은 값은 CPU가 무언가(네트워크, 디스크 등)를 기다리며 손가락질을 하고 있다는 훌륭한 지표입니다.

제 생각에는 NFS가 범인이 될 가능성이 적습니다. 우리는 NFS에 대해 상당히 광범위한 경험을 갖고 있으며 조정/최적화할 수는 있지만경향꽤 안정적으로 작동합니다.

GFS 구성 요소를 안정적으로 만든 다음 NFS 관련 문제가 사라지는지 확인하고 싶습니다.

마지막으로 OCFS2는 GFS를 대체할 수 있는 옵션이 될 수 있습니다. 분산 파일 시스템에 대해 연구하는 동안 꽤 많은 연구를 했는데 왜 OCFS2를 선택했는지 기억이 나지 않습니다. 하지만 그렇게 했습니다. 아마도 이는 Oracle이 데이터베이스 백엔드에 사용하는 OCFS2와 관련이 있을 수 있으며 이는 매우 높은 안정성 요구 사항을 의미합니다.

무닌은 당신의 친구입니다. 그러나 훨씬 더 중요한 것은 top / htop입니다. vmstat는 또한 몇 가지 주요 번호를 제공할 수도 있습니다.

$ vmstat 1

시스템이 정확히 무엇을 하는 데 시간을 소비하는지 매초마다 업데이트를 받게 됩니다.

행운을 빌어요!

Question 3

첫 번째 HA 프록시는 Varnish 또는 Nginx를 사용하여 웹 서버 앞에 있습니다.

그런 다음 웹 파일 시스템의 경우 NFS, GFS2 대신 내결함성이 있고 읽기 속도가 빠른 MooseFS를 사용하는 것이 좋습니다. NFS, GFS2에서 잃어버린 것은 로컬 잠금입니다. 애플리케이션에 이것이 필요합니까? 그렇지 않다면 MooseFS로 전환하고 NFS,GFS2 문제를 건너뛸 것입니다. MFS 메타데이터 서버를 HA하려면 Ucarp를 사용해야 합니다.

MFS에서는 복제 목표를 3으로 설정합니다.

# mfssetgoal 3 /폴더

//신자

Answer

첫 번째 HA 프록시는 Varnish 또는 Nginx를 사용하여 웹 서버 앞에 있습니다.

그런 다음 웹 파일 시스템의 경우 NFS, GFS2 대신 내결함성이 있고 읽기 속도가 빠른 MooseFS를 사용하는 것이 좋습니다. NFS, GFS2에서 잃어버린 것은 로컬 잠금입니다. 애플리케이션에 이것이 필요합니까? 그렇지 않다면 MooseFS로 전환하고 NFS,GFS2 문제를 건너뛸 것입니다. MFS 메타데이터 서버를 HA하려면 Ucarp를 사용해야 합니다.

MFS에서는 복제 목표를 3으로 설정합니다.

# mfssetgoal 3 /폴더

//신자

Question 4

munin 그래프에 따르면 시스템은 캐시를 삭제합니다. 이는 다음 중 하나를 실행하는 것과 같습니다.

echo 2 > /proc/sys/vm/drop_caches
1. 무료 덴트리와 아이노드
echo 3 > /proc/sys/vm/drop_caches
1. 무료 페이지 캐시, dentires 및 inode

문제는 왜 느린 크론 작업이 있는지에 대한 것입니다.

01:00 -> 12:00 외에는 일정한 간격을 두고 있는 것으로 보입니다.

위 명령 중 하나를 실행하면 문제가 다시 발생하는 경우 피크를 통해 약 1/2 지점을 확인하는 것도 가치가 있습니다.언제나sync그렇게 하기 전에 올바른 방향 으로 달리도록 하세요 .

strace예상되는 제거 시점과 해당 제거 시점에 drbd 프로세스 중 하나가 실패하면 (이것이 범인이라고 다시 가정), 약간의 빛을 비출 수 있습니다.

Answer

munin 그래프에 따르면 시스템은 캐시를 삭제합니다. 이는 다음 중 하나를 실행하는 것과 같습니다.

echo 2 > /proc/sys/vm/drop_caches
1. 무료 덴트리와 아이노드
echo 3 > /proc/sys/vm/drop_caches
1. 무료 페이지 캐시, dentires 및 inode

문제는 왜 느린 크론 작업이 있는지에 대한 것입니다.

01:00 -> 12:00 외에는 일정한 간격을 두고 있는 것으로 보입니다.

위 명령 중 하나를 실행하면 문제가 다시 발생하는 경우 피크를 통해 약 1/2 지점을 확인하는 것도 가치가 있습니다.언제나sync그렇게 하기 전에 올바른 방향 으로 달리도록 하세요 .

strace예상되는 제거 시점과 해당 제거 시점에 drbd 프로세스 중 하나가 실패하면 (이것이 범인이라고 다시 가정), 약간의 빛을 비출 수 있습니다.

느린 NFS 및 GFS2 성능

답변1

답변2

답변3

답변4

관련 정보