CUDA 12.1 与 PyTorch 2.1.0 环境:Windows/Linux 双系统配置 5 步验证法

发布时间:2026/7/6 1:48:09

CUDA 12.1 与 PyTorch 2.1.0 环境:Windows/Linux 双系统配置 5 步验证法 CUDA 12.1 与 PyTorch 2.1.0 环境Windows/Linux 双系统配置 5 步验证法对于需要在多系统间切换或团队协作的开发者来说统一的环境配置至关重要。本文将提供一套针对 Windows 11 和 Ubuntu 22.04 LTS 的标准化安装流程并通过 5 个关键检查点确保环境配置的正确性。1. 环境准备与兼容性检查在开始安装前我们需要确认硬件和系统的兼容性。NVIDIA GPU 是运行 CUDA 的必要条件而不同架构的 GPU 对 CUDA 版本的支持也有所不同。Windows 系统检查nvidia-smiLinux 系统检查nvidia-smi执行上述命令后你将看到类似如下的输出----------------------------------------------------------------------------- | NVIDIA-SMI 535.104.05 Driver Version: 535.104.05 CUDA Version: 12.2 | |--------------------------------------------------------------------------- | GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | || | 0 NVIDIA GeForce ... WDDM | 00000000:01:00.0 On | N/A | | N/A 45C P8 N/A / N/A | 100MiB / 8192MiB | 0% Default | ---------------------------------------------------------------------------关键信息是右上角显示的 CUDA 版本这表示你的显卡驱动支持的最高 CUDA 版本。CUDA 12.1 需要驱动版本至少为 530.30.02。系统要求对比表组件Windows 要求Linux 要求操作系统Windows 10/11 (64位)Ubuntu 20.04/22.04, CentOS 7GPUNVIDIA with Compute Capability 3.5同上内存建议 8GB建议 8GB存储空间至少 5GB 可用至少 5GB 可用2. 跨平台安装流程2.1 Windows 系统安装步骤 1安装 CUDA Toolkit 12.1访问 NVIDIA 开发者网站下载 CUDA 12.1 安装包运行安装程序选择自定义安装取消勾选Visual Studio Integration除非你需要开发 CUDA 程序完成安装后验证环境变量是否自动配置验证安装nvcc --version预期输出应显示 CUDA 12.1 版本信息。步骤 2安装 cuDNN下载与 CUDA 12.1 兼容的 cuDNN 版本8.9.x将下载的压缩包解压复制以下文件夹到 CUDA 安装目录binincludelib覆盖现有文件步骤 3安装 PyTorch 2.1.0使用 conda 或 pip 安装 PyTorch GPU 版本conda install pytorch2.1.0 torchvision0.16.0 torchaudio2.1.0 pytorch-cuda12.1 -c pytorch -c nvidia或pip install torch2.1.0 torchvision0.16.0 torchaudio2.1.0 --index-url https://download.pytorch.org/whl/cu1212.2 Linux 系统安装步骤 1安装 CUDA Toolkit 12.1对于 Ubuntu 22.04执行以下命令wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600 sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/3bf863cc.pub sudo add-apt-repository deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/ / sudo apt-get update sudo apt-get -y install cuda-12-1步骤 2配置环境变量echo export PATH/usr/local/cuda-12.1/bin${PATH::${PATH}} ~/.bashrc echo export LD_LIBRARY_PATH/usr/local/cuda-12.1/lib64${LD_LIBRARY_PATH::${LD_LIBRARY_PATH}} ~/.bashrc source ~/.bashrc步骤 3安装 cuDNN下载 cuDNN 8.9.x for CUDA 12.1 的 Linux 版本然后执行sudo cp cuda/include/cudnn*.h /usr/local/cuda-12.1/include sudo cp cuda/lib64/libcudnn* /usr/local/cuda-12.1/lib64 sudo chmod ar /usr/local/cuda-12.1/include/cudnn*.h /usr/local/cuda-12.1/lib64/libcudnn*步骤 4安装 PyTorch 2.1.0conda install pytorch2.1.0 torchvision0.16.0 torchaudio2.1.0 pytorch-cuda12.1 -c pytorch -c nvidia或pip install torch2.1.0 torchvision0.16.0 torchaudio2.1.0 --index-url https://download.pytorch.org/whl/cu1213. 5 步验证法为确保环境配置正确我们设计了以下 5 个关键检查点3.1 驱动版本验证Windows:nvidia-smiLinux:nvidia-smi检查输出中的 CUDA 版本是否 ≥ 12.13.2 CUDA 路径验证Windows/Linux:import os print(os.environ[CUDA_HOME]) # 或 os.environ[CUDA_PATH] print(os.environ[PATH])确保路径指向正确的 CUDA 12.1 安装目录3.3 PyTorch GPU 识别验证import torch print(torch.__version__) # 应显示 2.1.0 print(torch.cuda.is_available()) # 应返回 True print(torch.cuda.get_device_name(0)) # 显示你的 GPU 型号3.4 GPU 计算能力测试import torch # 创建一个随机张量并转移到 GPU x torch.randn(1000, 1000).cuda() y torch.randn(1000, 1000).cuda() # 执行矩阵乘法 z torch.matmul(x, y) print(z.mean()) # 打印计算结果3.5 简单模型推理测试import torch import torch.nn as nn # 定义一个简单的神经网络 class SimpleModel(nn.Module): def __init__(self): super().__init__() self.linear nn.Linear(10, 1) def forward(self, x): return self.linear(x) # 实例化模型并转移到 GPU model SimpleModel().cuda() # 创建测试数据 inputs torch.randn(5, 10).cuda() # 执行推理 outputs model(inputs) print(outputs)4. 常见问题解决方案问题 1CUDA 版本不匹配症状torch.cuda.is_available()返回 False解决方案确认安装的 PyTorch 版本与 CUDA 版本匹配检查环境变量是否正确设置重新安装匹配版本的 PyTorch问题 2cuDNN 未正确安装症状运行时出现cuDNN not found错误解决方案确认 cuDNN 文件已复制到 CUDA 安装目录检查文件权限是否正确重新下载并安装 cuDNN问题 3多 GPU 环境下的问题解决方案# 明确指定使用的 GPU 设备 torch.cuda.set_device(0) # 使用第一个 GPU # 或者在运行脚本前设置环境变量 # Linux/Mac: export CUDA_VISIBLE_DEVICES0 # Windows: set CUDA_VISIBLE_DEVICES05. 性能优化建议启用 cuDNN 基准测试torch.backends.cudnn.benchmark True使用混合精度训练scaler torch.cuda.amp.GradScaler() with torch.cuda.amp.autocast(): # 前向传播 outputs model(inputs) loss criterion(outputs, labels) # 反向传播 scaler.scale(loss).backward() scaler.step(optimizer) scaler.update()内存优化技巧# 清空缓存 torch.cuda.empty_cache() # 使用 pin_memory 加速数据加载 train_loader DataLoader(dataset, batch_size32, pin_memoryTrue)多进程数据加载DataLoader(dataset, batch_size32, num_workers4, pin_memoryTrue)通过这套标准化流程你可以确保在 Windows 和 Linux 系统上获得一致的开发体验。5 步验证法不仅能确认环境配置的正确性还能帮助你在早期发现潜在问题。

相关新闻