神舟t97 ubuntu16.4系统安装nvidia 驱动+cuda9.0 + cudnn7.1.2

阅读: 评论:0

神舟t97   ubuntu16.4系统安装nvidia 驱动+cuda9.0 + cudnn7.1.2

神舟t97 ubuntu16.4系统安装nvidia 驱动+cuda9.0 + cudnn7.1.2

神舟t97   ubuntu16.4系统安装nvidia 驱动+cuda9.0 + cudnn7.1.2

0前言

继续上篇博客《windwos10 +ubuntu16.4 双系统安装步骤(神舟t97)》,在t97上安装ubuntu16之后,为使用nvidia显卡的计算力,使t97成为深度学习的工作站,还要继续配置一系列nvidia显卡驱动、cuda工具、以及cudnn工具。因此本文会详细讲述nvidia驱动+cuda9.0+cudnn7.1.2的安装。

1前期工作

所需软件:①cuda9.0 下载地址    

             ②cudnn7.1.2下载地址   (注意下载cudnn需要nvidia注册账号,比简单)

               ③nvidia驱动下载地址  (选择自己对应的版本384.13)

!!!总结:所有的版本号是有cuda决定的,要选择对应的cudnn和nvidia driver版本

软件名称

版本号

Cuda

9.0   (384.13)    

Cudnn

7.1.2 for 9.0 

Nvidia  Driver

384.13

他们三者之间的关系:cuda决定nvidia和cudnn。因为截至到2018年4月30日,tensorflow-gpu还不支持cuda9.1因此要下载cuda9.0。与9.0对应的是cudnn7.1.2和nvidia384.13

小技巧:如果在linux的firefox浏览器下载以上三个软件,切记要更换为国内下载源否则下载会很慢,浪费时间。

切换方法:在下图一中搜索“软件和更新”,出现图二时,选择国内国内服务器,输入认证密码,便设置成功。这样下载软件就比较快了( pip install 更新国内源有其他方法) 图二

此时在firefox进行三个软件的下载,下载存储位置为“下载”文件夹。

因为“下载”是中文字符,在alt+CTRL+F1命令界面是无法进行中文输入的,所有要将cuda_9.0.176_384.81_linux.run和NVIDIA-Linux-x86_64-384.130.run复制到/usr/nvidiabag下。同时将这两个软件重命名为cuda9.384.run和nvidia.384.run(在下载文件中重命名)

------------------------------------------------------------------------------------------------

复制方法: cd/usr      #进入usr文件夹

          Sudo mkdir nvidiabag  #新建nvidiabag文件夹

           cd下载

 sudo cp cuda9.384.run    /usr/nvidiabag      #复制文件

          Sudo cp nvidia.384.run    /usr/nvidiabag  

------------------------------------------------------------------------------------------------ 

Cudnn-9.0-linux-x64-v7.1tgz 仍然放在“下载”文件夹中

2安装步骤

2.1安装cuda9.0

    2.1.1命令输入:$ lspci |grep -i nvidia         #确认可用的显卡

2.1.2!!!!重要:禁用nouveau drivers

禁用方法:$ : gedit  /etc/modprobe.f   

在文档最后输入:

 blacklist nouveau

 options nouveau modeset=0

保存退出后,在命令行中输入:

$ sudo update-initramfs -u    #更新kernel initramfs 

查看是否禁用成功:

命令输入:$ lsmod |grep nouveau  

#若打印出信息,则没有被禁用(需要直接删除(自行百度下))  

 #若没有打印信息,则被禁用继续下一步

   2.1.3停止X服务(桌面服务)

   ①命令输入$: service lightdm stop;

   ②出现黑色屏幕之后,同时按住 alt+ctrl+F1       进入命令行模式;

   ③登录用户名和密码,然后输入   $:su   ----》  输入密码,获得root权限

   ④命令输入 $: cd  /usr/nvidiabag     #cuda9.0安装软件和nvidia软件都在 usr下的nvidiabag文件夹中

  ⑤命令输入 $: sudo sh cuda9.384.run

开始运行,持续按回车就行。会遇到 yes/or 的问题,问是否安装 nvidia driver 时选择 yes ,是否安装 linux libray32 时选择 no ,选择是否 nvidia-x server ……选择 yes ,安装路径选择默认 default 即可。安装完成后出现下面

上图中的①②③分别表示--------------------------

红色方框①表示cuda9.0的安装位置

红色方框②表示安装路径待会要用

红色方框③表示卸载cuda和驱动的方法

-------------------------------------------------

继续第⑥步  命令输入 $: service lightdm start重启桌面服务  

第⑦步,进入桌面后,此时显示器的分辨率可能为小屏,修改分辨率为1920x1080的方法:终端中输入$:sudo gedit /etc/f

打开的文档如下图所式,修改红色方框中的内容,最大值分别增加 100

然后重启,$:reboot  #重启

便是正常的分辨率了。

第8步,验证nvidia driver 是否安装成功。终端输入$: nvidia-smi

输出界面应该为:下图中包含了 nVidia 的驱动 版本 384.130 和独立显卡的型号 GeForce gtx 1070max-q

 2.1.4配置cuda路径

 ①命令输入$ sudo gedit   /etc/profile

 ②在打开的文本最后输入

export  PATH = /usr/local/cuda-9.0/bin:$PATH    #这是刚刚的默认安装路径

export  LD_LIBRARY_PATH=/usr/local/cuda9.0/lib64:$ LD_LIBRARY_PATH

保存文件。如下图所示:

③在终端中输入 source    /etc/profile       #使配置生效

④检查cuda是否安装好

命令行输入$:cuda

然后按两下 tab键,出现信息,则表示安装成功

2.1.5卸载cuda9.0

--------------
卸载cuda
--------------
cd  /usr/local/cuda-9.0/bin/
sudo perl uninstall_cuda_9.0.pl

 2.2安装cudnn7.1.2

①命令输入$:cd 下载
②命令输入$: sudo tar xvf cudnn-9.0_linx-x64-v7.#解压并安装tgz
③命令输入$:cd cuda  #进入cuda文件
④sudo cp include/*   /usr/local/cuda-9.0/include       #将cuda文件的 /usr/local/cuda-9.0/include
⑤sudo cp lib64/libcudnn.so.7.1.2   /usr/local/cuda-9.0/lib64
⑥sudo cp lib64/libcudnn-static.a  /usr/local/cuda.9.0/lib64
-----
更新软连接
-----
⑦cd /usr/local/cuda-9.0/lib64
⑧ln-s libcudnn.so.7.1.2  libcudnn.so.7
⑨ln-s libcudnn.so.7 libcudnn.so

此时已经安装成功,按说应该全部配置成功。但是在终端输入$:nvidia-smi

此时没有GPU信息输出。我解决的方法就是按照2.3的步骤,重新安装了一边nvidia    driver    384.13(已经重命名为nvidia.384.run)

 2.3安装nvidia384.13

安装nvidia 驱动
①service lightdm stop
②sudo  ./ nvidia.384.run  -no-opengl-files
③service lightdm start
-------------------------------------------------
重新进入桌面后,发现屏幕分辨率不对,所以解决此问题(上面已经讲过)
-------------------------------------------------
①sudo gedit /etc/f
②修改数据   28.0-155.0
            43.0-172.0  #建议增大100
-------------------------------------------------
nvidia 驱动卸载方法
-------------------------------------------------
sudo <驱动名字>--uninstall

2.4 后续会继续安装tensorflow-gpu、 pycharm 以及DEEPQA在ubuntu中的配置问题。

 

本文发布于:2024-02-04 19:27:48,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170714751558792.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:神舟   系统安装   nvidia
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23