GPU驅動不可用
更新時間 2025-08-22 14:51:02
最近更新時間: 2025-08-22 14:51:02
分享文章
本文向您介紹如何解決GPU驅動不可用。
問題描述
GPU彈性云主機中,執行nvidia-smi命令查看GPU設備狀態或使用情況時,報錯無法執行指定的程序。具體顯示如下:
![]()
可能原因
GPU彈性云主機的GPU驅動狀態異常。
問題排查
不同的操作系統執行的命令有所不同,以CentOS系統為例,查看安裝驅動時的內核版本:
find /usr/lib/modules -name nvidia.ko![]()
執行uname -r查看當前內核版本:
![]()
如果安裝驅動的內核版本跟當前內核版本不一致,則是導致此問題的原因。
處理方法
方法一:重啟系統,選擇安裝GPU驅動時的內核版本啟動系統。
方法二:在現有內核版本的基礎上,重新安裝驅動。
(1) 執行 nvidia-uninstall命令,卸載驅動。或者執行sh NVIDIA-Linux-x86_64-******.run --uninstall,卸載驅動。
(2) 重新安裝GPU驅動。操作指導請參考:安裝GPU驅動。