여러 사용자를 위한 서버로 기계 학습 워크스테이션 설정

여러 사용자를 위한 서버로 기계 학습 워크스테이션 설정

회사는 머신러닝 워크스테이션을 구입하여 저에게 실행 및 유지 관리를 맡겼습니다.

목표: 자체 ML 애플리케이션을 개발하고 글로벌 지사에서 워크스테이션에 연결하여 자체 모델을 교육/실행할 수 있도록 합니다. 또한 다른 글로벌 팀이 분류 및 객체 감지 모델 교육을 시작할 수 있도록 표준 교육 프레임워크를 설정했습니다.

개발 언어: Python

워크스테이션 사양:

  • 우분투 18.04
  • GPU 드라이버와 일반 ML 라이브러리가 모두 사전 설치되어 제공됩니다.
  • 인텔 코어 i9-9920X, 4x RTX 2080 Ti
  • 128GB RAM, 2TB NVMe + 2TB SATA SSD

현재 계획은 모든 사용자에 대해 서로 다른 사용자 계정을 설정하고 각자의 계정으로 SSH를 연결하는 것입니다. 그러나 나는 이것이 성공할 것이라고 확신하지 않습니다. 사용자가 다른 라이브러리 버전 등을 원하면 어떻게 되나요?

도커 컨테이너가 갈 길입니까? 이렇게 하면 모든 사람이 원하는 대로 자유롭게 설정할 수 있는 자신만의 격리된 환경을 가질 수 있습니다. 최근에 Python 가상 환경에 대해서도 배웠는데 지금은 이것이 가장 간단한 솔루션처럼 들립니다.

저는 이 분야에 대한 경험이 많지 않으며 이제 막 시작하는 단계입니다. 경험/제안을 공유해 주세요. 추가 세부정보가 필요하면 알려주세요. 감사합니다!

답변1

Python 가상 환경은 귀하의 사용 사례에 딱 맞습니다. 이렇게 하면 모든 프로젝트에 대해 Python 패키지 종속성이 있으므로 전역 설치 및 버전 불일치를 방지할 수 있습니다.

모든 사용자는 자신의 시스템 계정을 가지며 하나 이상의 가상 환경에 액세스할 수 있습니다.

프로젝트당 하나의 가상 환경을 고려해야 합니다.

게다가 당신은 사용할 수 있습니다피엔브여러 Python 버전으로 작업/전환할 수 있습니다.

또한 여기서 유일한 단점은 추가 디스크 공간이 필요하다는 것입니다.

답변2

docker도 가능하지만 구성 오버헤드가 너무 클 수 있습니다.

하지만,콘다 환경해결책이 될 수도 있습니다. 이를 통해 서로 다른 (파이썬) 라이브러리가 서로 격리된 환경에서 공존할 수 있습니다. 가장 쉬운 방법은 Miniconda를 시스템 전체에 설치하고 모든 사람이 원하는 대로 자신만의 conda 환경을 만들 수 있도록 하는 것입니다.

관련 정보