首先通过以下命令查看是否GPU驱动成功:
注意:需要在bash终端输入 import tensorflow as tfhello = tf.constant('Hello, TensorFlow!')sess = tf.Session()print(sess.run(hello)) 如果成功驱动GPU你会在终端上看到类似GPU的型号,内存等信息 会看到-例如:name: Tesla P100-PCIE-16GB major: 6 minor: 0 memoryClockRate(GHz): 1.3285 pciBusID: 0000:00:04.0 totalMemory: 15.90GiB freeMemory: 15.61GiB ......... physical GPU (device: 0, name: Tesla P100-PCIE-16GB, pci bus id: 0000:00:04.0, compute capability: 6.0) 如果没有请根据以下步骤进行处理:⬇️⬇️⬇️
查看GPU显存情况:
了解watch功能:whatis watch基本用法:watch [options] command示例:watch -n 5 nvidia-smi
所有软件的version都需要match上哦:
我目前cloud配置版本:
tensorflow-gpu ->1.13.0
CUDA -> 10.0.130
CUDNN -> 7.5.0
1.查看Tensorflow版本:
import tensorflow as tftf.__version__
2. 查看CUDA的版本 :
cat /usr/local/cuda/version.txt
3. 查看CUDNN的版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
4. 安装tensorflow到pip下
1)安装pip和pip3
sudo apt-get install python-pip python-dev # for Python 2.7sudo apt-get install python3-pip python3-dev # for Python 3.n
2)安装tensorflow
$ pip install tensorflow # Python 2.7; CPU support (no GPU support)$ pip3 install tensorflow # Python 3.n; CPU support (no GPU support)$ pip install tensorflow-gpu # Python 2.7; GPU support$ pip3 install tensorflow-gpu # Python 3.n; GPU support 不加版本的话默认是最新版本,如果想下特定的版本可在tensorflow后面加上版本号,例如第一个可以写成pip install tensorflow==1.1.0
根据以上GPU即可启动。
Tips:
Linux下更新CUDNN和CUDA。 软件官网下载地址:
下载CUDNN后解压
# 先删除系统的就版本文件 sudo rm -rf /usr/local/cuda/include/cudnn.hsudo rm -rf /usr/local/cuda/lib64/libcudnn*
# cd到解压的cuda文件后 sudo cp include/cudnn.h /usr/local/cuda/include/sudo cp lib64/lib* /usr/local/cuda/lib64/
更新CUDA也是同样的道理。
祝大家好运,少踩坑!