
公司購買了機器學習工作站並讓我負責運作和維護。
目標:開發我們自己的 ML 應用程序,並允許我們的全球辦事處連接到工作站來訓練/運行自己的模型。我還將為其他全球團隊設定標準訓練框架,以開始訓練分類和物件偵測模型。
開發語言:Python
工作站規格:
- 烏班圖18.04
- GPU 驅動程式和常見的 ML 程式庫均已預先安裝
- 英特爾酷睿 i9-9920X、4 個 RTX 2080 Ti
- 128 GB 記憶體、2 TB NVMe + 2 TB SATA 固態硬碟
目前的計劃是為所有用戶設定不同的用戶帳戶,他們將 ssh 進入自己的帳戶。但是,我不相信這會起作用。當使用者想要不同的庫版本等時會發生什麼?
docker 容器是正確的選擇嗎?這樣每個人都可以擁有自己的隔離環境,可以依照自己的喜好自由設定。我最近也了解了 python 虛擬環境,這聽起來是現在最簡單的解決方案。
我在這方面沒有太多經驗,我才剛開始。請分享您的經驗/建議,如果您需要更多詳細信息,請告訴我,謝謝!
答案1
Python 虛擬環境完全適合您的用例。這樣,每個專案都將具有 python 套件依賴關係,從而避免全域安裝和版本不匹配。
每個使用者都會有自己的系統帳戶,並且可以存取一個或多個虛擬環境。
每個項目應考慮一個虛擬環境。
另外你可以使用pyenv使您能夠使用多個 python 版本進行工作/切換。
此外,這裡唯一的缺點是您將需要額外的磁碟空間。
答案2
雖然 docker 是一種可能性,但它可能會帶來太多的配置開銷。
然而,康達環境可能是個解決方案。這些允許不同的(python)庫在彼此相鄰的隔離環境中共存。最簡單的方法是在系統範圍內安裝 Miniconda,並讓每個人根據需要創建自己的 conda 環境。