R&D를 위한 이기종 클러스터 솔루션

Question 1

여러 시스템의 리소스를 단일 이미지로 결합할 수 없다는 @NikitaKipriyanov의 의견에 동의합니다. 과거에 이를 수행한 상용 제품이 있었고 대기 시간을 줄이기 위해 인피니밴드에 의존했습니다(IMHO, 제대로 작동하지 않았습니다). Slurm은 스케줄러로 사용할 수 있지만 대화형 작업에도 사용할 수 있으며 리소스 관리자 역할을 더 많이 수행할 수 있습니다.

각 작업은 CPU 코어 수, GPU 수 및 유형, 메모리 양 등을 지정할 수 있습니다. 그런 다음 스케줄러는 적절하고 사용되지 않는 시스템을 선택하고 쉘 프롬프트를 제공합니다. 필요한 경우 X11 전달을 사용할 수 있습니다.

또한 컨테이너는 R&D 환경에서 매우 유용할 수 있습니다. 유틸리티가 보이지 않는다고 해서 버려서는 안 되지만 이것이 이 문제에 대한 해결책은 아닙니다.

Answer

여러 시스템의 리소스를 단일 이미지로 결합할 수 없다는 @NikitaKipriyanov의 의견에 동의합니다. 과거에 이를 수행한 상용 제품이 있었고 대기 시간을 줄이기 위해 인피니밴드에 의존했습니다(IMHO, 제대로 작동하지 않았습니다). Slurm은 스케줄러로 사용할 수 있지만 대화형 작업에도 사용할 수 있으며 리소스 관리자 역할을 더 많이 수행할 수 있습니다.

각 작업은 CPU 코어 수, GPU 수 및 유형, 메모리 양 등을 지정할 수 있습니다. 그런 다음 스케줄러는 적절하고 사용되지 않는 시스템을 선택하고 쉘 프롬프트를 제공합니다. 필요한 경우 X11 전달을 사용할 수 있습니다.

또한 컨테이너는 R&D 환경에서 매우 유용할 수 있습니다. 유틸리티가 보이지 않는다고 해서 버려서는 안 되지만 이것이 이 문제에 대한 해결책은 아닙니다.

Question 2

그것은 불가능합니다.

CPU가 다르면 지침도 다를 수 있습니다. CPU 간에 코드를 마이그레이션하려는 경우 이는 악몽입니다.
메모리 대기 시간은 나노초 단위이고, 네트워크 대기 시간은 수십 마이크로초입니다.

워크로드에 따라 워크로드를 변환하여 여러 컴퓨터에서 실행하고 컴퓨터 간에 데이터를 통신할 수 있습니다. 일부 문제의 경우 이는 사소한 일이며 데이터 세트를 더 작은 파티션으로 분할하고 병렬로 작업할 수 있습니다. 다른 워크로드의 경우 이는 어렵습니다. 하지만 이를 위해서는 운영 체제가 아닌 워크로드 수정이 필요합니다.

Answer

그것은 불가능합니다.

CPU가 다르면 지침도 다를 수 있습니다. CPU 간에 코드를 마이그레이션하려는 경우 이는 악몽입니다.
메모리 대기 시간은 나노초 단위이고, 네트워크 대기 시간은 수십 마이크로초입니다.

워크로드에 따라 워크로드를 변환하여 여러 컴퓨터에서 실행하고 컴퓨터 간에 데이터를 통신할 수 있습니다. 일부 문제의 경우 이는 사소한 일이며 데이터 세트를 더 작은 파티션으로 분할하고 병렬로 작업할 수 있습니다. 다른 워크로드의 경우 이는 어렵습니다. 하지만 이를 위해서는 운영 체제가 아닌 워크로드 수정이 필요합니다.

R&D를 위한 이기종 클러스터 솔루션

답변1

답변2

관련 정보