自 QingCloud DeepLearning 推出以來,吸引了很多用戶。深度學(xué)習(xí)框架本身都在比較快的更新,例如 TensorFlow 基本每個(gè)月都會(huì)有版本更新。除了深度學(xué)習(xí)框架自身的版本及其 CPU/GPU 版的區(qū)分外,CUDA 及 cuDNN 也區(qū)分不同版本,再加上 Python 的不同版本,使得配置深度學(xué)習(xí)開發(fā)及部署環(huán)境異常復(fù)雜。
為了解決上述問題并滿足用戶以后在 Kubernetes 上運(yùn)行深度學(xué)習(xí)應(yīng)用的需求,青云QingCloud 推出 DeepLearning 深度學(xué)習(xí)平臺(tái)容器版,并為非容器版提供了更多版本框架的安裝包。CPU 在深度學(xué)習(xí)任務(wù)中也能發(fā)揮重要作用,聯(lián)合英特爾發(fā)布的 CPU 優(yōu)化版,為一些深度學(xué)習(xí)應(yīng)用的長(zhǎng)期部署提供了價(jià)廉物美的解決方案。據(jù)測(cè)試,英特爾優(yōu)化版的 TensorFlow,在 16 核 Broadwell 平臺(tái)上,ResNet 50 的推理速度可達(dá) 40 imgs/s,能夠滿足輕量級(jí)模型的訓(xùn)練和推理需求。
GPU 是深度學(xué)習(xí)的重要資源,之前版本只能監(jiān)控到 CPU 和內(nèi)存的狀態(tài),用戶運(yùn)行 GPU 任務(wù)時(shí),無法方便查看 GPU 的使用狀態(tài),新版本中 GPU 狀態(tài)(核心和顯存使用狀況)可以在監(jiān)控界面直接查看。此次更新包含以下版本功能升級(jí):立即使用→
1.2 GPU 容器基礎(chǔ)版/容器高級(jí)版
- 宿主機(jī)中預(yù)裝 NVIDIA Driver(387.26), CUDA(9.1), nvidia-docker2, Docker(18.03.1-ce);
- 宿主機(jī)中預(yù)置包含 TensorFlow(1.8.0), Keras(2.2.0), PyTorch(0.4.1), Caffe(BVLC 1.0) 框架的 Docker 鏡像;
- 提供適用于青云云平臺(tái)的5個(gè)深度學(xué)習(xí)框架的鏡像倉庫:DeepLearning, TensorFlow, Keras, PyTorch, Caffe; 每個(gè)倉庫包含多個(gè)不同 Python 版本,不同 CUDA 及 cuDNN 版本的 docker 鏡像;
- 增加 GPU 監(jiān)控功能,隨時(shí)掌握 GPU 使用狀況;
- 內(nèi)置 GPU 容器版的 Deep Learning 測(cè)試Demo;
1.2 CPU 容器版
- 宿主機(jī)中預(yù)裝 Docker(18.03.1-ce);
- 宿主機(jī)中預(yù)置包含 TensorFlow(1.8.0), Keras(2.2.0), PyTorch(0.4.1), Caffe(BVLC 1.0) 框架的 Docker 鏡像;
- 提供適用于青云云平臺(tái)的5個(gè)深度學(xué)習(xí)框架的鏡像倉庫:DeepLearning, TensorFlow, Keras, PyTorch, Caffe; 每個(gè)倉庫包含多個(gè)不同 Python 版本,不同 CUDA 及 cuDNN 版本的 docker 鏡像;
- 內(nèi)置 CPU 容器版的 Deep Learning 測(cè)試Demo;