作者: Sam (甄峰) sam_code@hotmail.com
之前在Linux下使用Paddle及其相关工具,之后想把它放在手头一台训练机上,但对Linux下安装Cuda信心不足。所以采用Windows。没想到也遇到一些问题,记录下来备忘。
0. 背景介绍:
0.1:训练机介绍:
主板为技嘉B85M-D3V-A. 显卡为Nvidia GeForce RTX 2070. 使用WD 1T
硬盘和一个附加硬盘盒。
0.2:Cuda安装背景:
Paddle-GPU版本,支持win7 win8, win10.
支持CUDA9.0, CUDA10.0, CUDA10.1, CUDA10.2,
CUDA11.0.
并需要安装cudnn.
所以,需求很明确:
A. 安装GeForce RTX2070 driver.
https://www.nvidia.cn/Download/index.aspx?lang=cn
B. 安装Cuda Toolkit.
https://developer.nvidia.cn/cuda-toolkit-archive
C. 安装cudnn.
https://developer.nvidia.com/rdp/cudnn-archive
D. 安装Python+pip.
https://www.python.org/downloads/windows/
E. 安装Paddle.
1. 初次尝试(踩坑SHA-2):
首先安装Win7 Professional版本。 在安装RTX2070
Driver时报错,要求安装SHA-2补丁。并指出补丁下载地址,下载后,却告知此补丁不适合当前版本。
网上有朋友指出,需要win7 sp1才可以使用此补丁。或者使用win10. 它已经将SHA-2内置。
1.1: 踩坑 Nvidia driver和Cuda版本:
Nvidia
driver版本和cuda版本有其对应关系,安装driver后,需要查看其最大支持的cuda版本,再行安装,否则会产生错误如下:
(base) PS C:\Program Files\NVIDIA GPU Computing
Toolkit\CUDA\v11.0\extras\demo_suite>
.\deviceQuery.exe
C:\Program Files\NVIDIA GPU Computing
Toolkit\CUDA\v11.0\extras\demo_suite\deviceQuery.exe
Starting...
CUDA Device Query (Runtime API) version
(CUDART static linking)
cudaGetDeviceCount returned 35
-> CUDA driver version is insufficient for CUDA runtime
version
Result = FAIL
这里表示driver版本与CUDA版本不匹配。
那如何知道对应关系呢? 有两个途径:
A. https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
这里明确指出了其对应关系。
B.
而driver的版本是:391.35
A,B两组方法可以互相印证。
2. Win10版本+Nvidia driver + Cuda + cudnn:
2.1:安装driver.
此次安装Nvidia driver, 则没什么问题。
注意,Nvidia driver. 要选择正确的 设备和操作系统。
2.2:安装cuda toolkit:
cuda Toolkit, 则选择10.2.
https://developer.nvidia.cn/cuda-toolkit-archive
安装成功后的验证:
nvcc --version
可以看到,显示了10.2版本。
2.3:安装cudnn:
paddle中说明:CUDA
工具包9.0/10.0/10.1/10.2 配合 cuDNN v7.6.5+
所以选择 cudnn7.6.5 for cuda10.2.
https://developer.nvidia.com/rdp/cudnn-archive
下载解压后,包含bin,include,lib三个目录。
把cuda\bin\cudnn64_7.dll复制到 C:\Program Files
\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin 目录下.
b) 把\cuda\ include\cudnn.h复制到 C:\Program Files
\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include 目录下.
c) 把\cuda\lib\x64\cudnn.lib复制到C:\Program Files
\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64 目录下.
3. Python安装和其它相关:
正常安装,记得点选加入PATH复选框。
4. 安装Paddle-GPU版本:
python -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple
验证:
import paddle
paddle.utils.run_check()
若显示类似信息,表示安装成功:
PaddlePaddle works well on 1
GPU.
W0408 12:04:04.227409 8860
build_strategy.cc:171] fusion_group is not enabled for
Windows/MacOS now, and only effective when running with CUDA
GPU.
PaddlePaddle works well on 1 GPUs.
PaddlePaddle is installed successfully! Let's start deep
learning with PaddlePaddle now.
安装PaddleDetection
git clone
https://gitee.com/paddlepaddle/PaddleDetection
安装paddlehub:
pip install
paddlehub