使用 Windows GPU云主機搭建深度學習環境
更新時間 2023-09-15 11:09:09
最近更新時間: 2023-09-15 11:09:09
分享文章
本文介紹如何使用 Windows GPU云主機搭建深度學習環境。
背景信息
實例環境如下表所示。
| 實例類型 | pi2.2xlarge.4 |
|---|---|
| 操作系統 | Windows Server 2019數據中心版 64位 中文版 |
| CPU | 8vCPU |
| 內存 | 32GB |
| GPU | NVIDIA T4 * 1張 |
| 驅動及相關庫、軟件版本 | CUDA11.3.0、Python 3.9、cuDNN8.2.1、Pytorch 1.11.0、Tensorflow_gpu_2.6.0 |
說明如何選擇對應版本請參見如何選擇驅動及相關庫、軟件版本。
操作步驟
步驟一: 創建GPU實例
請參見用戶指南-?>創建GPU云主機?>創建未配備驅動的GPU云主機,創建GPU云主機實例。
步驟二:安裝顯卡驅動
- 登錄已創建的GPU云主機,操作參見Windows彈性云主機登錄方式概述。
- 訪問 ,選擇顯卡的驅動版本。單擊“SEARCH”進入下載頁面,單擊進行下載。
- 完成下載后,根據提示完成安裝。
步驟三:安裝CUDA
- 訪問英偉達官網 ,選擇對應版本。


- 進入 CUDA Toolkit 11.3.0 Download 頁面,選擇對應系統配置。


- 單擊 “Download”,開始下載。
- 下載完成后,請雙擊安裝包,并根據提示進行安裝。


請注意以下步驟:
在彈出的 CUDA Setup Package 窗口中,Extraction path 為暫時存放地址,無需修改,保持默認并單擊 OK。


在許可協議步驟中,選擇“自定義”并單擊“下一步”。


根據實際需求選擇安裝組件,并單擊“下一步”。

完成安裝,根據提示重啟云主機。
步驟四:配置環境變量
- 在操作系統界面
使用“win +R”快捷鍵打開運行。 - 在運行窗口中輸入 sysdm.cpl,并單擊“確定”。


- 在打開的系統屬性窗口中,選擇“高級”頁簽,并單擊“環境變量”。


- 選擇系統變量中的“Path”,單擊“編輯”。


- 在彈出的編輯環境變量窗口中,新建并輸入如下環境變量配置(部分已有的無需再次新建)。
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.3
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.3\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.3\libnvvp
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.3\lib\x64
C:\Program Files\NVIDIA Corporation\NVSMI

- 連續單擊3次“確定”,保存設置。
步驟五:檢查顯卡驅動及CUDA
- 在操作系統界面使用“win +R”快捷鍵打開運行。
- 在運行窗口中輸入 cmd,并單擊“確定”。


- 在 cmd 窗口中,執行以下命令,檢查顯卡驅動是否安裝成功。
nvidia-smi


執行以下命令,檢查 CUDA 是否安裝成功。
nvcc -V
返回如下圖所示界面表示 CUDA 安裝成功。


步驟六:安裝cuDNN
- 前往 頁面,單擊“Archived cuDNN Releases”,查看更多版本。
- 找到所需 cuDNN 版本,并下載。


- 解壓 cuDNN 壓縮包,并將 bin、include 及 lib 文件夾拷貝至 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.3目錄下。


至此已完成 cuDNN 安裝。
步驟七:安裝Anaconda深度學習庫
建議通過創建的虛擬環境安裝Pytorch和Tensorflow。通過Anaconda,可便捷獲取包并對包進行管理,同時可統一管理環境。Anaconda 包含了conda、Python在內的超過180個科學包及其依賴項,安裝過程簡單,能高性能使用Python和R語言,且有免費的社區支持。
- 前往,在頁面中下載所需版本,以Anaconda3-2021.11-Windows-x86_64為例。
- 請雙擊安裝包,并根據頁面提示進行安裝。請注意在Choose Install Location步驟中,更改默認安裝路徑。因默認安裝路徑C盤中的 ProgramData文件夾為隱藏文件夾,為了方便管理,建議安裝在其他文件夾。




- 單擊“Install”,根據提示完成安裝。


步驟八:配置Anaconda深度學習庫。
- 在操作系統界面,單擊左下角的

,在彈出菜單中選擇 Anaconda Prompt。


- 在打開的 Anaconda Prompt 命令行窗口中,執行以下命令,創建虛擬環境。
conda create -n xxx_env python=3.9
說明xxx_env 為環境名,python=3.11 為 Python 版本,您可根據實際需求進行修改。
如下所示即為安裝成功。


您可使用以下命令進入或退出已創建的虛擬環境。進入虛擬環境后,即可按照實際需求安裝包。
#激活命令
conda activate xxx_env
#退出命令
conda deactivate
步驟九:安裝Pytorch。
前往,使用官網推薦的安裝代碼。本文已安裝 CUDA 版本為11.3,在已創建的 xxx_env 虛擬環境中執行如下命令進行安裝:
# CUDA 11.3
conda install pytorch==1.10.1 torchvision==0.11.2 torchaudio==0.10.1 cudatoolkit=11.3
步驟十:安裝Tensorflow。
- 執行以下命令,安裝 Tensorflow_gpu_2.6.0。
pip install tensorflow-gpu==2.6.0 -i //pypi.tuna.tsinghua.edu.cn/simple
- 執行以下命令,安裝 keras。
pip install keras -i //pypi.tuna.tsinghua.edu.cn/simple
深度學習庫的安裝已基本完成。您可參考本文方法安裝更多所需要的包,并利用 Anaconda 自帶的 jupyter notebook、Spyder 工具或者安裝 PyCharm 等工具開始代碼學習。