| 惠於 GPU 可大量平行之計算特性,以 GPU
進行 Machine Learning、Deep Learning 或 AI 的訓
練計算加速,已是目前的主流方法。然而受限於
GPU 此類裝置於電腦系統的獨佔特性、以及面對
各式 AI 計算軟體堆疊環境之複雜度,如何將一具
有多 GPU 伺服器系統以多人共享、快速部署、簡
易使用之原則提供給組織或團隊共用,為本文主
要欲解決之問題。我們採用現有受歡迎之輕量化
容器虛擬化技術,搭配前端使用者入口,後端 API
server、資料庫、帳號認證、儲存服務等子系統,
並考慮基本的資安要求,實作一個可提供 GPU 容
器 AI 計算服務之輕量化雲端平台。因使用開放原
始碼軟體設計與實作,可以做為有意搭建 GPU 私
有雲、並提供 AI 訓練計算的個人或團體之參考。 |