别再装虚拟机了!Windows 一键拥有 Linux 环境,并跑通你的第一个视觉大模型

发布时间:2026/6/10 14:30:48

别再装虚拟机了!Windows 一键拥有 Linux 环境,并跑通你的第一个视觉大模型 摘要很多刚入门大模型、视觉大模型、多模态大模型的同学第一步不是卡在论文而是卡在环境。教程里动不动就是安装 Linux 双系统配置虚拟机安装 CUDA安装 cuDNN配环境变量装 PyTorch下载模型跑不起来C 盘爆炸对于新手来说这一套流程非常劝退。其实如果你是 Windows 用户现在已经不一定要装传统虚拟机也不一定要折腾双系统。更推荐的方式是Windows WSL2 Ubuntu Conda PyTorch 视觉大模型这篇文章会从零开始带你在 Windows 上安装 Linux 环境并最终跑通一个真正的视觉大模型。本文适合大模型入门新手视觉大模型 / 多模态大模型方向研究生Windows 用户不想装虚拟机、不想装双系统的人想用 conda 管理深度学习环境的人担心 C 盘爆满的人一、为什么跑大模型更推荐 Linux在大模型和深度学习领域Linux 是更常见的开发环境。原因很简单服务器基本都是 LinuxCUDA、PyTorch、Transformers、DeepSpeed、vLLM 等工具在 Linux 下更稳定论文代码通常默认按 Linux 环境写后续你上实验室服务器、云服务器也基本都是 Linux命令行、脚本、环境管理更统一。但是很多同学自己的电脑是 Windows。这个时候最推荐的方案不是装虚拟机而是使用 WSL2。二、什么是 WSL2WSL 的全称是Windows Subsystem for Linux也就是 Windows 的 Linux 子系统。简单理解它可以让你在 Windows 上直接运行一个 Linux 系统。你可以在 Windows 电脑上打开 Ubuntu 终端使用 Linux 命令例如lscdsudoaptupdate conda activate python train.py它不像传统虚拟机那么笨重也不像双系统那样需要重启切换系统。对于大模型学习和日常开发来说WSL2 是非常适合新手的方案。最终你的电脑结构大概是这样Windows └── WSL2 └── Ubuntu └── Conda └── PyTorch └── 视觉大模型三、安装 WSL2 Ubuntu1. 打开 PowerShell 管理员模式在 Windows 搜索栏搜索PowerShell右键选择以管理员身份运行然后输入wsl--install执行完成后按提示重启电脑。2. 第一次打开 Ubuntu重启后在开始菜单搜索Ubuntu第一次打开时会让你创建 Linux 用户名和密码。例如用户名james 密码自己设置注意输入密码时终端不会显示字符这是正常现象。3. 检查 WSL 版本在 PowerShell 中输入wsl-l-v如果看到类似结果NAME STATE VERSION Ubuntu Running 2说明 Ubuntu 已经安装成功并且是 WSL2。如果 VERSION 不是 2可以执行wsl--set-versionUbuntu 2四、强烈建议把 Ubuntu 迁移到 G 盘防止 C 盘爆满跑大模型最容易爆的不是代码而是conda 环境pip 缓存PyTorch 包Hugging Face 模型权重数据集checkpoint如果默认安装 WSLUbuntu 很可能会占用 C 盘空间。WSL2 的 Ubuntu 本质上会对应一个虚拟磁盘文件通常叫ext4.vhdx所以如果你的 C 盘不大建议直接把 Ubuntu 迁移到 G 盘。1. 查看你的 Ubuntu 名称PowerShell 输入wsl-l-v假设看到NAME STATE VERSION Ubuntu Running 2那么你的发行版名字就是Ubuntu如果你看到的是Ubuntu-22.04那么后面的命令里就把Ubuntu替换成Ubuntu-22.04。2. 进入 Ubuntu记录默认用户打开 Ubuntu输入whoami假设输出james然后执行printf[user]\ndefault%s\n$USER|sudotee/etc/wsl.conf这一步是为了防止迁移后默认用户变成 root。3. 关闭 WSL回到 PowerShellwsl--shutdown4. 创建 G 盘目录mkdir G:\WSL mkdir G:\WSL\Ubuntu mkdir G:\WSL\Backup5. 导出整个 Ubuntuwsl--export Ubuntu G:\WSL\Backup\Ubuntu.tar如果你的发行版叫Ubuntu-22.04就用wsl--export Ubuntu-22.04 G:\WSL\Backup\Ubuntu-22.04.tar这一步会把整个 Ubuntu 打包包括Linux 系统condaPython 环境已安装的包项目文件Hugging Face 模型缓存6. 注销 C 盘旧 Ubuntu确认导出成功后再执行wsl--unregister Ubuntu注意这一步会删除 C 盘旧 Ubuntu。7. 从 G 盘重新导入wsl--import Ubuntu G:\WSL\Ubuntu G:\WSL\Backup\Ubuntu.tar--version 2导入后检查wsl-l-v然后启动 Ubuntuwsl-d Ubuntu8. 检查迁移是否成功进入 Ubuntu 后执行whoamipwd再检查 condaconda--versioncondaenvlist如果之前已经装过模型可以检查 Hugging Face 缓存du-sh~/.cache/huggingface迁移完成后你的 Ubuntu 主体就会在G:\WSL\Ubuntu以后你在 Ubuntu 里安装的环境、模型、项目只要放在 Linux 主目录中就会占用 G 盘而不是 C 盘。五、更新 Ubuntu 基础环境进入 Ubuntu 后先更新系统包sudoaptupdatesudoaptupgrade-y安装常用基础工具sudoaptinstall-ybuild-essentialgitwgetcurlunzipvimca-certificates这些工具的作用大概是build-essential编译工具 git下载 GitHub 项目 wget/curl下载文件 unzip解压文件 vim命令行编辑器 ca-certificatesHTTPS 证书六、安装 Miniconda不建议新手直接在系统 Python 里乱装包。更推荐用 conda 创建独立环境。先进入用户主目录cd~下载 Minicondawgethttps://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh执行安装bash./Miniconda3-latest-Linux-x86_64.sh安装过程中Do you accept the license terms? yes 安装路径直接回车 Do you wish to initialize Miniconda3? yes安装完成后刷新配置source~/.bashrc检查 conda 是否安装成功conda--version如果能看到版本号说明安装成功。七、创建视觉大模型专用环境以后不要直接在 base 环境里装深度学习包。我们创建一个专门的环境conda create-nvlmpython3.11-y激活环境conda activate vlm升级 pippython-mpipinstall--upgradepip以后每次跑视觉大模型项目都先执行conda activate vlm八、配置 NVIDIA GPU如果你有 NVIDIA 显卡先在 Windows PowerShell 里输入nvidia-smi如果能看到显卡信息例如NVIDIA GeForce RTX 3060 Driver Version: xxx CUDA Version: xxx说明 Windows 已经识别显卡。然后进入 Ubuntu也输入nvidia-smi如果 Ubuntu 里也能看到显卡信息说明 WSL2 已经能调用 GPU。这里有一个非常重要的点WSL2 下不要在 Ubuntu 里安装 NVIDIA Linux 显卡驱动。你只需要在 Windows 侧安装或更新 NVIDIA 驱动即可。WSL2 会通过 Windows 驱动把 GPU 能力暴露给 Linux 环境。九、安装 PyTorch在vlm环境里执行conda activate vlm然后安装 PyTorch。示例命令如下pipinstalltorch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128如果你的显卡或驱动不适合这个版本可以去 PyTorch 官网选择OS: Linux Package: Pip Language: Python Compute Platform: CUDA然后复制官网给出的安装命令。安装完成后测试 PyTorch 是否能调用 GPUpython-cimport torch; print(torch.__version__); print(torch.cuda.is_available()); print(torch.cuda.get_device_name(0))如果输出类似True NVIDIA GeForce RTX ...说明 PyTorch GPU 环境成功。十、安装视觉大模型相关包我们这里以 Qwen2.5-VL 为例。先安装常用依赖pipinstall-Utransformers accelerate pillow requests sentencepiece再安装 Qwen 视觉输入处理工具pipinstallqwen-vl-utils如果后面要处理视频可以安装pipinstallqwen-vl-utils[decord]如果运行 Qwen2.5-VL 时出现KeyError: qwen2_5_vl可以改用最新版 Transformers 源码安装pipinstallgithttps://github.com/huggingface/transformers accelerate十一、跑通第一个视觉大模型这里选择Qwen/Qwen2.5-VL-3B-Instruct不要一上来就跑 7B、14B、72B。新手第一步不是追求大而是先把完整链路跑通Linux 环境 → Conda → PyTorch → CUDA → Transformers → 视觉大模型推理1. 创建项目目录mkdir-p~/projects/vlm_testcd~/projects/vlm_test2. 新建测试脚本vimtest_qwen_vl.py写入下面代码fromtransformersimportQwen2_5_VLForConditionalGeneration,AutoProcessorfromqwen_vl_utilsimportprocess_vision_infoimporttorch model_nameQwen/Qwen2.5-VL-3B-InstructmodelQwen2_5_VLForConditionalGeneration.from_pretrained(model_name,torch_dtypeauto,device_mapauto)processorAutoProcessor.from_pretrained(model_name)messages[{role:user,content:[{type:image,image:https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-VL/assets/demo.jpeg,},{type:text,text:请用中文描述这张图片。},],}]textprocessor.apply_chat_template(messages,tokenizeFalse,add_generation_promptTrue)image_inputs,video_inputsprocess_vision_info(messages)inputsprocessor(text[text],imagesimage_inputs,videosvideo_inputs,paddingTrue,return_tensorspt,)inputsinputs.to(model.device)generated_idsmodel.generate(**inputs,max_new_tokens128)generated_ids_trimmed[out_ids[len(in_ids):]forin_ids,out_idsinzip(inputs.input_ids,generated_ids)]output_textprocessor.batch_decode(generated_ids_trimmed,skip_special_tokensTrue,clean_up_tokenization_spacesFalse)print(output_text[0])保存退出按 Esc 输入 :wq 回车3. 运行模型python test_qwen_vl.py第一次运行会自动下载模型文件速度取决于网络情况。如果一切正常你会看到模型对图片的中文描述。这就说明你的 Windows 电脑已经通过 WSL2 跑通了 Linux 环境并且成功运行了一个视觉大模型。十二、模型文件下载到哪里了Hugging Face 模型默认会缓存到~/.cache/huggingface可以查看大小du-sh~/.cache/huggingface也可以查看具体模型ls~/.cache/huggingface/hub如果你已经把 Ubuntu 迁移到了 G 盘那么这些模型缓存也会随着 Ubuntu 虚拟磁盘一起占用 G 盘空间。十三、推荐的日常项目目录建议以后项目放在~/projects例如~/projects/vlm_test ~/projects/papers ~/projects/datasets不要长期放在/mnt/c/Users/你的用户名/Desktop也不要把大模型项目放在 Windows 桌面、下载目录里。原因是Linux 文件系统下速度更好权限问题更少后续迁移和备份更统一不容易把 C 盘撑爆。十四、常用命令总结查看 WSL 发行版wsl-l-v启动 Ubuntuwsl-d Ubuntu关闭 WSLwsl--shutdown激活 conda 环境conda activate vlm查看 conda 环境condaenvlist查看 GPUnvidia-smi测试 PyTorch GPUpython-cimport torch; print(torch.cuda.is_available()); print(torch.cuda.get_device_name(0))查看 Hugging Face 模型缓存大小du-sh~/.cache/huggingface查看家目录占用du-sh~十五、常见问题1. 为什么不用传统虚拟机传统虚拟机当然可以但对新手来说更重需要单独分配内存需要配置虚拟硬盘文件互通麻烦GPU 配置更复杂性能开销更明显WSL2 更适合 Windows 用户快速进入 Linux 开发环境。2. 为什么不用双系统双系统性能很好但缺点也明显安装风险更高磁盘分区麻烦Windows 和 Linux 需要重启切换新手容易误删分区不适合作为第一套学习环境如果只是为了学习大模型、跑论文代码、配置实验环境WSL2 已经足够好用。3. 为什么要用 conda因为深度学习项目非常容易出现依赖冲突。例如一个项目需要Python 3.10 PyTorch 2.x CUDA 11.8 Transformers 某个版本另一个项目可能需要完全不同的版本。conda 可以让我们为不同项目创建不同环境conda create-nvlmpython3.11conda create-nclippython3.10conda create-nllamapython3.11这样项目之间不会互相污染。4. 没有 NVIDIA 显卡可以跑吗可以跑但会很慢。没有 NVIDIA 显卡时PyTorch 只能使用 CPU。小模型测试可以真正跑视觉大模型会非常吃力。如果你是研究生后续真正做实验大概率还是需要实验室服务器云服务器NVIDIA GPU至少 12GB 以上显存更推荐 24GB 或更高显存5. 一上来能不能跑 7B 或 14B不建议。新手第一步应该是跑通链路而不是追求模型参数量。推荐顺序先跑 3B 再跑 7B 再研究量化 再研究 LoRA 微调 再研究评测和训练环境没跑通之前直接上大模型只会让问题变得更复杂。十六、本文最终完成了什么到这里我们完成了1. Windows 上安装 WSL2 2. 安装 Ubuntu 3. 将 Ubuntu 迁移到 G 盘避免 C 盘爆满 4. 更新 Linux 基础环境 5. 安装 Miniconda 6. 创建视觉大模型 conda 环境 7. 安装 PyTorch 8. 验证 CUDA/GPU 9. 安装 Transformers 和 qwen-vl-utils 10. 跑通 Qwen2.5-VL-3B-Instruct 视觉大模型也就是说我们不需要传统虚拟机不需要双系统就可以在 Windows 上拥有一个接近真实 Linux 服务器的深度学习开发环境。总结对于刚入门大模型、视觉大模型、多模态大模型的同学我非常推荐这条路线Windows WSL2 Ubuntu Conda PyTorch Transformers它比传统虚拟机轻比双系统简单又比纯 Windows 环境更接近真实科研和服务器环境。最关键的是先别急着追模型多大、论文多新先把环境链路跑通。只要你能成功跑通第一个视觉大模型后面再去研究 CLIP、BLIP、LLaVA、Qwen-VL、InternVL、MiniGPT-4、微调、LoRA、评测就会顺很多。环境不是终点但它是进入视觉大模型研究的第一道门。

相关新闻