以下操作以Ubuntu 16.04 64bit操作系統,GPU實例安裝CUDA 10.1對應的Tesla驅動為例。
說明
Linux內核版本和驅動的版本存在兼容性關系。如果驅動安裝失敗,請檢查驅動安裝日志(安裝日志通常位于/var/log/nvidia-installer.log)。 日志中如提示失敗原因為驅動編譯錯誤,例如 get_user_pages參數不匹配,說明當前內核版本與驅動版本不兼容,請選擇合適的內核版本和驅動版本重新安裝。建議內核版本與驅動版本發布時間不要相差過大。
- 登錄云主機。
- 根據操作系統選擇命令更新系統軟件。
? Ubuntu
更新軟件安裝源:apt-get -y update
安裝必要程序:apt-get install gcc g++ make
? CentOS
更新軟件安裝源:yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
安裝必要程序:yum install -y kernel-devel-uname -r gcc gcc-c++
- 下載NVIDIA驅動包。
單擊NVIDIA驅動()下載根據實例的類型,選擇驅動版本。單擊“SEARCH”。
如下圖

- 根據需求選擇驅動版本,以下操作以選擇Tesla 418.67為例。
圖 選擇驅動版本

- 單擊需要下載的驅動,進入“TESLA DRIVER FOR LINUX X64”界面,單擊“DOWNLOAD”。
- 復制下載鏈接地址。
圖 復制下載鏈接地址

- 在云主機內部執行如下命令進行下載。
wget 復制的鏈接地址
例如:wget //us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run
圖 獲取安裝包

- 執行以下命令安裝驅動。
sh NVIDIA-Linux-x86_64-418.67.run
- (可選)如果執行驅動安裝命令后出現如下提示信息,需要禁用nouveau驅動。
圖 禁用nouveau驅動

a. 執行以下命令,查看是否安裝Nouveau驅動。
lsmod | grep nouveau
- 如果回顯信息中包含Nouveau驅動信息,說明Nouveau驅動已安裝,則需要禁用Nouveau驅動,請執行步驟9.b。
- 如果回顯信息沒有Nouveau驅動信息,說明Nouveau驅動已被禁用,請執行步驟9.d。
b. 執行如下命令編輯blacklist.conf文件。
如果沒有“/etc/modprobe.d/blacklist.conf”文件,請新建一個。
vi /etc/modprobe.d/blacklist.conf
添加如下語句添加至文件結尾。
blacklist nouveau
options nouveau modeset=0
c. 執行以下命令,備份并新建一個initramfs。
- Ubuntu系統:
sudo update-initramfs -u - CentOS系統:
mv /boot/initramfs-?(uname -r).img /boot/initramfs-(uname -r).img.bak
dracut -v /boot/initramfs-?(uname -r).img (uname -r)
d. 執行以下命令,重啟云主機。
reboot
- 根據安裝提示,連續三次選擇“OK”。完成驅動的安裝。
圖 NVIDIA驅動安裝完成

- 執行命令設置systemd。
systemctl set-default multi-user.target
- 執行reboot,重啟云主機。
- 登錄云主機,執行nvidia-smi,如果回顯信息中包含了已安裝的驅動版本,說明驅動安裝成功。
圖 查看NVIDIA驅動的版本
