GPU云主機在實際的使用中往往需要安裝驅動、CUDA工具包、cuDNN、Pytorch等相關的庫或軟件版本。
如何選擇CUDA版本
CUDA(Compute Unified Device Architecture),是顯卡廠商NVIDIA推出的運算平臺。 CUDA?是一種由NVIDIA推出的通用并行計算架構,該架構使GPU能夠解決復雜的計算問題。 它包含了CUDA指令集架構(ISA)以及GPU內部的并行計算引擎。 開發人員可以使用C語言來為CUDA?架構編寫程序,所編寫出的程序可以在支持CUDA?的處理器上以超高性能運行。
在選擇CUDA版本前,需要先了解GPU云主機所掛載的顯卡的算力,然后根據顯卡算力來選擇對應的CUDA版本。
具體步驟如下:
步驟一 :通過查看顯卡算力。以NVIDIA T4 為例,可以看到其顯卡計算能力為7.5。


步驟二 :根據顯卡計算能力查看可支持CUDA版本,詳情請參見。以NVIDIA T4 為例,CUDA 10以上的版本均能夠支持,建議您選擇最新版本的CUDA。

如何選擇顯卡驅動版本
根據確定的CUDA版本來選擇顯卡的驅動版本,如下圖所示。例如您選擇的CUDA版本為11.4.3,使用linux操作系統時,驅動版本應大于450.80.02。詳情請參見。

如何選擇cuDNN版本
NVIDIA CUDA 深度神經網絡庫 (cuDNN) 是一個 GPU 加速的深度神經網絡基元庫,能夠以高度優化的方式實現標準例程(如前向和反向卷積、池化層、歸一化和激活層)。借助 cuDNN,研究人員和開發者可以專注于訓練神經網絡及開發軟件應用,而不必花時間進行低層級的 GPU 性能調整。cuDNN 可加速廣泛應用的深度學習框架,包括 Caffe2、Chainer、Keras、MATLAB、MxNet、PaddlePaddle、PyTorch 和 TensorFlow。根據選擇的CUDA版本選擇對應的cuDNN 版本,版本對應關系及cuDNN下載地址可參考如下鏈接:。
如何選擇Pytorch版本
根據選擇的CUDA版本選擇對應的Pytorch 版本,版本對應關系可參考如下鏈接:。