ubuntu服务器安装cuda11.0、cuDNN入门教程

在 Ubuntu 服务器上安装 CUDA 11.0 和 cuDNN 的详细教程如下。本教程涵盖了从环境准备到安装和验证的完整流程,适用于初学者。

一、环境准备

1. 系统要求

  • 操作系统:Ubuntu 18.04 或 20.04
  • GPU:NVIDIA GPU,支持 CUDA 11.0(如 Tesla、GeForce RTX 系列等)
  • 权限:需要 sudo 权限
  • 驱动程序:NVIDIA 驱动需支持 CUDA 11.0

2. 卸载旧版本(如有)

清理可能存在的旧版本 CUDA 和 NVIDIA 驱动:

sudo apt-get --purge remove "*nvidia*"
sudo apt-get autoremove
sudo apt-get autoclean

二、安装 NVIDIA 驱动

1. 检查 GPU 支持情况

使用 lspcinvidia-smi 确认是否已安装支持的 GPU:

lspci | grep -i nvidia

如果 nvidia-smi 已输出驱动信息,则 NVIDIA 驱动已安装,可以跳过驱动安装部分。

2. 安装 NVIDIA 驱动

安装合适的 NVIDIA 驱动:

sudo apt update
sudo apt install -y nvidia-driver-450

说明nvidia-driver-450 是支持 CUDA 11.0 的推荐驱动版本。

重启服务器以使驱动生效:

sudo reboot

验证驱动是否正常:

nvidia-smi

三、安装 CUDA 11.0

1. 下载 CUDA Toolkit 11.0

访问 NVIDIA CUDA Toolkit Archive,选择 CUDA Toolkit 11.0,并下载对应的 Debian 文件

直接下载命令:

wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb

2. 安装 CUDA

  1. 添加 CUDA 本地仓库:
sudo dpkg -i cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu2004-11-0-local/7fa2af80.pub

2. 更新并安装 CUDA:

sudo apt update
sudo apt install -y cuda

3. 配置环境变量

将 CUDA 的路径添加到系统变量:

echo 'export PATH=/usr/local/cuda-11.0/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

4. 验证 CUDA 安装

运行以下命令查看 CUDA 版本:

nvcc --version

输出示例:

Cuda compilation tools, release 11.0, V11.0.221

四、安装 cuDNN

1. 下载 cuDNN

访问 NVIDIA cuDNN 下载页面,选择与 CUDA 11.0 兼容的版本(如 cuDNN 8.x)。

需要登录 NVIDIA 开发者账户后下载。

直接下载(假设文件名为 cudnn-11.0-linux-x64-v8.0.4.30.tgz):

wget https://developer.download.nvidia.com/compute/machine-learning/cudnn/secure/8.0.4/11.0_20200826/cudnn-11.0-linux-x64-v8.0.4.30.tgz

2. 解压并安装 cuDNN

  1. 解压文件:
tar -xzvf cudnn-11.0-linux-x64-v8.0.4.30.tgz

2. 将库文件复制到 CUDA 的目录:

sudo cp cuda/include/cudnn*.h /usr/local/cuda-11.0/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.0/lib64/
sudo chmod a+r /usr/local/cuda-11.0/include/cudnn*.h /usr/local/cuda-11.0/lib64/libcudnn*

3. 验证 cuDNN 安装

运行以下命令验证 cuDNN 版本:

cat /usr/local/cuda-11.0/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

输出示例:

#define CUDNN_MAJOR 8
#define CUDNN_MINOR 0
#define CUDNN_PATCHLEVEL 4

五、测试 CUDA 和 cuDNN

1. CUDA 示例测试

  1. 进入 CUDA 示例程序目录:
cd /usr/local/cuda-11.0/samples/1_Utilities/deviceQuery

2. 编译示例程序:

sudo make
3. 运行测试:
./deviceQuery

输出示例:

Result = PASS

2. cuDNN 示例测试

下载 cuDNN 示例程序或编写简单代码调用 cuDNN API,测试其功能。

六、常见问题排查

  1. nvccdeviceQuery 无法找到:
    • 确认 CUDA 路径已正确配置。
    • 检查 /usr/local/cuda-11.0/bin 是否存在。
  2. nvidia-smi 无法识别 GPU:
    • 确保 NVIDIA 驱动已正确安装并匹配 GPU 型号。
    • 尝试重装驱动。
  3. cuDNN 版本不兼容:
    • 确认下载的 cuDNN 版本与 CUDA 11.0 兼容。

七、总结

通过上述步骤,你已经成功在 Ubuntu 服务器上安装了 CUDA 11.0 和 cuDNN,并验证了其功能。接下来,你可以使用这些工具进行深度学习模型的训练和开发。若有其他问题,可以随时提问!

发布者:myrgd,转载请注明出处:https://www.object-c.cn/4423

Like (0)
Previous 2024年11月22日 下午7:33
Next 2024年11月23日 下午1:49

相关推荐

  • 在 Apache Spark 中,任务的切分(Task Division)机制

    在 Apache Spark 中,任务的切分(Task Division)是 Spark 将应用程序逻辑划分为多个并行任务的核心机制。任务切分的主要原则是基于数据分区和操作算子。以下是任务切分的核心原则和关键影响因素: 1. Spark 任务切分的基本概念 2. 任务切分的原则 2.1 基于分区(Partition)的切分 2.2 基于依赖关系(Depend…

    2024年11月25日
    00
  • 通过 PHP 读取微软邮箱(Outlook/Office 365 邮箱)

    通过 PHP 读取微软邮箱(Outlook/Office 365 邮箱)邮件,通常需要使用 Microsoft Graph API,因为微软逐步淘汰了基于用户名和密码的 IMAP/SMTP 方式。Microsoft Graph API 支持 OAuth2.0 认证,可以安全地访问和管理用户邮件。 以下是实现读取微软邮箱邮件的完整示例。 实现步骤 1. 准备工…

    2024年11月25日
    00
  • STM32 的串口(RS485)数据收发通信模式

    STM32 的串口(RS485)数据收发需要使用 RS485 协议,这是一种常用于工业设备和长距离通信的串行通讯标准。RS485 支持半双工通信,即数据可以在同一线路上进行收发。STM32 支持通过 UART 串口来配置 RS485 模式,利用硬件流控制进行数据收发。以下是实现 STM32 与 RS485 数据收发的基本步骤。 1. 硬件连接 RS485 与…

    2024年11月25日
    00
  • 在 Apache Kafka 中消息的消费和传递通过消费者与 Kafka 的分布式系统协作完成

    在 Apache Kafka 中,消息的消费和传递是通过消费者(Consumer)与 Kafka 的分布式系统协作完成的。以下是消息传递的主要流程: 1. Producer 生产消息到 Kafka 2. Consumer 消费消息 Kafka 中消费者的消息消费流程如下: 2.1 订阅主题 消费者通过 Kafka 客户端订阅一个或多个主题。它可以: 2.2 …

    2024年12月9日
    00
  • 若依集成 X-File-Storage 框架(实现图片上传阿里云 OSS 服务器)

    若依(Ruoyi)是一款基于 Spring Boot 的企业级开发框架,在此框架中集成 X-File-Storage 框架来实现图片上传到阿里云 OSS(对象存储服务)是一个常见的需求。通过这个集成,你可以便捷地将图片或文件上传到阿里云 OSS,并在系统中管理和访问这些文件。以下是详细的步骤说明: 1. 安装 X-File-Storage 框架 X-File…

    2024年11月25日
    00
  • 使用 OpenVPN 将多个局域网互联的一种配置方案

    使用 OpenVPN 将多个局域网互联是一个常见需求,尤其是在远程办公或多地分支机构互联场景下。以下是一种基于 OpenVPN 的配置方案,旨在实现多个局域网的互联。 场景说明 网络拓扑图 配置步骤 1. 安装 OpenVPN 在所有相关设备上安装 OpenVPN。以下以 Linux 为例: 2. 配置 OpenVPN 服务器 创建服务器配置文件 编辑 /e…

    2024年12月7日
    00
  • 在 Nuxt.js 应用中,webpack 的 compile 事件钩子构建过程

    在 Nuxt.js 应用中,webpack 的 compile 事件钩子通常用于在构建过程中处理或监听 Webpack 编译的状态。webpack 是 Nuxt.js 中的核心构建工具之一,而 Nuxt.js 本身是基于 Webpack 配置的,允许你通过扩展 Webpack 配置来进行自定义。要使用 webpack 的 compile 事件钩子,首先你需要…

    2024年11月29日
    00
  • 在 Linux 系统上配置 Hadoop 环境,包括创建 hadoop 用户、更新 apt、安装 SSH 和配置 Java 环境

    以下是详细的步骤,用于在 Linux 系统上配置 Hadoop 环境,包括创建 hadoop 用户、更新 apt、安装 SSH 和配置 Java 环境。 1. 创建 Hadoop 用户创建一个名为 hadoop 的新用户: 根据提示设置密码和用户信息。 将 hadoop 用户添加到 sudo 组(可选): 切换到 hadoop 用户: 2. 更新 APT 包…

    2024年12月1日
    00
  • 本地部署VMware ESXi服务并实现实现无公网IP远程访问服务器

    要在本地部署 VMware ESXi 服务,并实现无公网 IP 的情况下远程访问和管理 ESXi 服务器,您可以通过以下几种方法来完成。这些方法包括使用 VPN、反向代理、NAT(端口转发)等方式。下面是具体步骤和建议。 1. 使用 VPN(虚拟私人网络)访问 通过 VPN 将远程客户端与本地网络连接,从而可以通过局域网(LAN)访问 VMware ESXi…

    2024年11月24日
    00
  • Apache DolphinScheduler 一款分布式大数据工作流调度系统

    Apache DolphinScheduler 是一款分布式大数据工作流调度系统。Task 是其核心组件之一,用于定义和调度具体的任务。以下是基于 Apache DolphinScheduler 3.1.9 的 Task 处理流程的解析: 1. Task 提交 在 DolphinScheduler 中,Task 的生命周期通常由用户提交一个具体的任务定义开始…

    2024年12月7日
    00
  • 微信支付域名回调用个人服务器域名的方法

    在使用微信支付功能时,微信支付的回调需要指定合法的 支付回调通知地址(即回调域名)。如果你想使用个人服务器的域名来作为微信支付的回调域名,需要满足以下条件并完成配置: 1. 域名要求 合法域名的要求 2. 配置个人服务器域名 步骤 1:准备域名 步骤 2:设置 HTTPS 步骤 3:配置域名解析 3. 微信支付后台配置 3. 保存配置。 4. 在代码中处理回…

    2024年11月24日
    00
  • 在工业场景中使用 Apache Flink 处理 Kafka 数据是一种常见的实时流处理方案

    在工业场景中使用 Apache Flink 处理 Kafka 数据是一种常见的实时流处理方案,特别是针对 ChangeRecord 数据类型时,能够帮助实现高效的实时 ETL(提取、转换、加载)或事件驱动的应用。以下是关于如何用 Flink 处理 Kafka 数据,并重点解析 ChangeRecord2 的详细步骤和注意事项。 1. ChangeRecord…

    2024年12月5日
    00
  • Docker 部署 Navidrome 服务器与远程访问听歌的教程

    Navidrome 是一个轻量级、功能强大的音乐流媒体服务器,可以通过 Docker 容器方便地部署。本教程涵盖从本地部署到远程访问的详细步骤。 一、环境准备 1. 安装 Docker 和 Docker Compose 在服务器(或本地机器)上安装 Docker 和 Docker Compose。 安装 Docker Ubuntu 示例: CentOS 示例…

    2024年11月22日
    00
  • 远程访问 VMware ESXi 主机的方法

    远程访问 VMware ESXi 主机可以通过以下几种方式实现。具体方法取决于你的网络环境和目标需求,例如是否有公网 IP,是否需要加密传输等。以下是详细教程: 1. 基于公网 IP 的直接访问 1.1 适用场景 1.2 操作步骤 2. 使用 VPN 隧道访问 2.1 适用场景 2.2 操作步骤 3. 配置跳板机访问 3.1 适用场景 3.2 操作步骤 远程…

    2024年11月24日
    00
  • 在 CANoe 的 Test Module 中进行压力测试和鲁棒性测试

    在 CANoe 的 Test Module 中进行压力测试和鲁棒性测试,可以通过以下步骤快速构建并执行相关测试: 1. 定义测试目标 首先明确测试的具体内容,例如: 具体的目标可以包括: 2. 配置 CANoe 环境 确保 CANoe 配置已准备好,包含: 3. 创建压力测试脚本 在 Test Module 中使用 CAPL 或 Test Case Edit…

    2024年12月5日
    00

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

在线咨询: QQ交谈

邮件:723923060@qq.com

关注微信