您可根據如下操作步驟自行安裝Tesla驅動,如要安裝CUDA工具包請參見安裝CUDA。
如何選擇驅動版本請參見如何選擇驅動及相關庫、軟件版本。
前提條件
- GPU云主機未安裝驅動。
- GPU云主機配備彈性IP。
一 、Centos 操作系統驅動安裝
1.下載對應驅動。訪問,選擇對應GPU型號、操作系統和CUDA Toolkit版本后,進行下載,本文以 A100 為例,如下圖所示。

2.點擊搜索,選擇要下載的驅動版本,點擊下載。

3.將下載的驅動安裝包上傳到云主機中,執行以下命令,對安裝包添加執行權限。
例如,對文件名為NVIDIA-Linux-x86_64-470.199.02.run添加執行權限。
chmod +x NVIDIA-Linux-x86_64-470.199.02.run
4.安裝kernel-devel、gcc包,注意kernel-devel版本要和內核版本保持一致。
sudo yum install -y gcc kernel-devel
5.執行以下命令,運行驅動安裝程序,并按提示進行后續操作。
sudo sh NVIDIA-Linux-x86_64-418.126.02.run --disable-nouveau --kernel-source-path=/usr/src/kernels/$(uname -r)
6.安裝完成后,執行以下命令進行驗證。
nvidia-smi
如返回信息類似下圖中的 GPU 信息,則說明驅動安裝成功。

7.(可選)GPU驅動開啟持久化模式
Persistence-M(Persistence Mode)是一個用戶可設置的驅動程序屬性的術語。啟用持久性模式后,即使沒有活動的客戶端,NVIDIA驅動程序也會保持加載狀態。這樣可以最大程度地減少與運行依賴的應用程序(例如 CUDA 程序)相關的驅動程序加載延遲,同時減少GPU云主機掉卡問題的發生。
cd /usr/share/doc/NVIDIA_GLX-1.0/sample*
bunzip2 nvidia-persistenced-init.tar.bz2
tar xvf nvidia-persistenced-init.tar
cd nvidia-persistenced-init && sh install.sh -u root
二 、Ubuntu操作系統 驅動安裝
1.下載對應驅動。訪問,選擇對應GPU型號、操作系統和CUDA Toolkit版本后,進行下載,本文以 A100 為例,如下圖所示。

2.點擊搜索,選擇要下載的驅動版本,點擊下載。

3.將下載的驅動安裝包上傳到云主機中,執行以下命令,對安裝包添加執行權限。 例如,對文件名為NVIDIA-Linux-x86_64-470.199.02.run添加執行權限。
chmod +x NVIDIA-Linux-x86_64-470.199.02.run
4.安裝gcc和linux-kernel-headers。
sudo apt-get install gcc linux-kernel-headers
5.執行以下命令,運行驅動安裝程序,并按提示進行后續操作。
sudo sh NVIDIA-Linux-x86_64-418.126.02.run --disable-nouveau
6.安裝完成后,執行以下命令進行驗證。
nvidia-smi
如返回信息類似下圖中的 GPU 信息,則說明驅動安裝成功。

7.(可選)GPU驅動開啟持久化模式
Persistence-M(Persistence Mode)是一個用戶可設置的驅動程序屬性的術語。啟用持久性模式后,即使沒有活動的客戶端,NVIDIA驅動程序也會保持加載狀態。這樣可以最大程度地減少與運行依賴的應用程序(例如 CUDA 程序)相關的驅動程序加載延遲,同時減少GPU云主機掉卡問題的發生。
cd /usr/share/doc/NVIDIA_GLX-1.0/sample*
bunzip2 nvidia-persistenced-init.tar.bz2
tar xvf nvidia-persistenced-init.tar
cd nvidia-persistenced-init && sh install.sh -u root
三 、Windows操作系統驅動安裝
1.下載對應驅動。在云主機內訪問,選擇對應GPU型號、操作系統和CUDA Toolkit版本后,進行下載,本文以 A100 為例,如下圖所示。

2.點擊搜索,選擇要下載的驅動版本,點擊下載。

3.打開下載驅動程序所在的文件夾,雙擊安裝文件開始安裝,按照界面上的提示安裝驅動程序并根據需要重啟GPU云主機。
4.安裝完成后查看設備管理器,顯示如下則表示驅動安裝成功。
