LAN의 여러 서버에서 Slurm과 같은 HPC 관리자 사용

Question

예, 컴퓨팅 클러스터입니다. 동일한 워크로드를 처리하는 여러 컴퓨팅 노드라는 광범위한 정의가 있습니다. 컴퓨팅 작업자를 실행하는 여러 호스트가 있는 대규모 빌드 팜이 적합합니다. TOP500 목록에 있는 거대한 시스템도 마찬가지입니다.

더 중요한 것은 slurm의 기능을 활용하여 여러 노드를 관리하는 것입니다. 그렇지 않으면 하나의 컨트롤러만 자체적으로 관리하는 것은 단순한 시스템에 비해 기능이 많지 않기 때문에 상당히 복잡합니다. 모든 노드를 추가하고 파티션으로 나눕니다.

둘 이상의 노드를 요청하는 작업에서는 프로그램이 MPI에서와 같이 다중 노드를 인식해야 합니다. 일반적인 인식되지 않는 프로그램의 경우 요청을 하나의 노드에 유지하면 됩니다.

저장소의 경우 파일을 노드로 가져오려면 무언가를 설계해야 합니다. 일반적으로 옵션은 다음과 같습니다.

Answer 1

예, 컴퓨팅 클러스터입니다. 동일한 워크로드를 처리하는 여러 컴퓨팅 노드라는 광범위한 정의가 있습니다. 컴퓨팅 작업자를 실행하는 여러 호스트가 있는 대규모 빌드 팜이 적합합니다. TOP500 목록에 있는 거대한 시스템도 마찬가지입니다.

더 중요한 것은 slurm의 기능을 활용하여 여러 노드를 관리하는 것입니다. 그렇지 않으면 하나의 컨트롤러만 자체적으로 관리하는 것은 단순한 시스템에 비해 기능이 많지 않기 때문에 상당히 복잡합니다. 모든 노드를 추가하고 파티션으로 나눕니다.

둘 이상의 노드를 요청하는 작업에서는 프로그램이 MPI에서와 같이 다중 노드를 인식해야 합니다. 일반적인 인식되지 않는 프로그램의 경우 요청을 하나의 노드에 유지하면 됩니다.

저장소의 경우 파일을 노드로 가져오려면 무언가를 설계해야 합니다. 일반적으로 옵션은 다음과 같습니다.

관련 정보