一、准备工作
1. 确认是CUDA9.1 支持的Linux系统版本
2. 确认是CUDA9.1 支持的GPU卡
参考https://developer.nvidia.com/cuda-gpus
3. 确认gcc已安装
输入gcc –version命令,如果有报错信息,需要重新安装gcc
4. 确认安装了正确版本的kernel-devel和
kernel-headers
uname –r 查看内核版本,确保安装的kernel-devel和kernel-headers的版本和内核版本一致(Redhat下可以用 rpm –qa|grep kernel)。
5. 下载CUDA
下载链接:https://developer.nvidia.com/cuda-downloads
下图标识是Redhat6 64位的下载示例:
二、安装CUDA
1. 禁用nouveau驱动
先执行命令:lsmod | grep nouveau 如果有返回信息,当前系统中是加载了nouveau驱动模块。
禁用方法:
1.1 Redhat/Centos:
创建文件:/etc/modprobe.d/blacklist-nouveau.conf,在文件中添加以下两行内容:
blacklist nouveau
options nouveau modeset=0
然后执行命令sudo dracut –force
1.2 OpenSuse:
创建文件:/etc/modprobe.d/blacklist-nouveau.conf,在文件中添加以下两行内容:
blacklist nouveau
options nouveau modeset=0
然后执行命令sudo /sbin/mkinitrd
1.3 SLES:
SLES系统中没有安装nouveau驱动,不需要再禁用。
1.4 Ubuntu:
创建文件:/etc/modprobe.d/blacklist-nouveau.conf,在文件中添加以下两行内容:
blacklist nouveau
options nouveau modeset=0
然后执行命令sudo update-initramfs –u
进入文本模式
设置默认启动方式为文本模式
2.1 Redhat6/Centos6:
编辑inittab,设置成id:3:initdefault:
2.2 Redhat7/Centos7:
执行命令:systemctl set-default multi-user.target
然后重启服务器,进入文本模式
3. 确认Nouveau驱动是否禁用成功
执行lsmod | grep nouveau 如果没有返回信息,说明已经禁用成功。
4. 安装CUDA
4.1执行命令 sudo sh cuda_<version>_linux.run –no-opengl-libs
其中cuda_<version>_linux.run 以下载的cuda安装文件名为准。
关于参数–no-opengl-libs: 如果机器以该GPU卡做显示输出,就不要加这个参数,如果服务器不是用NIVIDA GPU卡做显示输出,一定要加上这个参数,如果不加这个参数,后面安装自动过程中,会有安装nvidia opengl lib的提示,如果选择安装了nividia的 opengl lib,重启后图形化桌面会启动失败。
开始安装后会有几次提示,如果没有特殊需求,默认安装即可:
EULA 协议的接受
CUDA 驱动的安装
CUDA Toolkit 安装, 位置, 和 /usr/local/cuda 符号链接
CUDA Samples安装和位置
4.2 修改默认启动方式为图形化界面启动
4.2.1 Redhat6/Centos6:
编辑inittab,设置成id:5:initdefault:
4.2.2 Redhat7/Centos7:
执行命令:systemctl set-default graphical.target
然后重启进入图形化界面
5.检测device node是否创建成功
在/dev目录下执行ll 查看是否有nvidia开头的文件
6.增加环境变量
编辑/etc/profile文件在末尾追加信息,完成后执行source /etc/profile 即可生效。
6.1 export PATH=/usr/local/cuda-9.1/bin${PATH:+:${PATH}}
6.2 64位系统:
export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
32位系统:
export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
三、验证
1.查看驱动版本
执行命令:cat /proc/driver/nvidia/version
2.查看GPU卡信息
执行命令:nividia-smi