WSL2 + Ubuntu 22.04 保姆级教程:手把手教你用 Conda 搞定 LLaMA-Factory 微调环境

发布时间:2026/6/14 17:43:05

WSL2 + Ubuntu 22.04 保姆级教程:手把手教你用 Conda 搞定 LLaMA-Factory 微调环境 WSL2 Ubuntu 22.04 保姆级教程手把手教你用 Conda 搞定 LLaMA-Factory 微调环境在人工智能技术快速发展的今天大语言模型的微调能力已成为开发者必备技能。LLaMA-Factory作为一款强大的开源工具让模型微调变得可视化、简单化。但对于刚接触Linux环境的AI初学者来说环境搭建往往成为第一道门槛。本文将彻底解决这个问题从零开始带你完成WSL2配置、Ubuntu系统优化、Conda环境管理到LLaMA-Factory完美运行的完整流程。1. 环境准备打造高效的WSL2工作空间1.1 Windows系统要求检查在开始前请确保你的Windows版本满足以下条件Windows 10版本2004或更高推荐Windows 1164位操作系统已启用虚拟化技术可在任务管理器→性能选项卡中查看验证命令systeminfo | find 系统类型预期应显示x64-based PC。1.2 安装WSL2核心组件以管理员身份运行PowerShell执行wsl --install -d Ubuntu-22.04这个命令会自动完成启用适用于Linux的Windows子系统功能启用虚拟机平台功能下载最新版Ubuntu 22.04 LTS发行版安装完成后需要重启系统。首次启动Ubuntu时会提示创建用户名和密码请牢记此密码后续sudo操作需要用到。1.3 基础系统配置优化更新软件源并升级现有包sudo apt update sudo apt upgrade -y安装常用工具包sudo apt install -y build-essential git curl wget unzip配置SSH服务可选但推荐sudo apt install -y openssh-server sudo service ssh start2. Conda环境管理Python项目的隔离方案2.1 Miniconda安装与配置下载最新版Miniconda比Anaconda更轻量wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh执行安装脚本bash Miniconda3-latest-Linux-x86_64.sh安装过程中注意按Enter阅读许可协议输入yes同意条款建议安装在默认位置/home/用户名/miniconda3最后选择yes初始化conda生效配置source ~/.bashrc验证安装conda --version2.2 配置国内镜像源修改conda源加速下载conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge conda config --set show_channel_urls yes同时配置pip源pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple3. LLaMA-Factory项目部署3.1 获取项目源码创建项目目录并克隆仓库mkdir ~/ai_projects cd ~/ai_projects git clone https://github.com/hiyouga/LLaMA-Factory cd LLaMA-Factory3.2 创建专用Python环境使用conda创建隔离环境Python 3.10已验证兼容性最佳conda create -n llama_factory python3.10 -y conda activate llama_factory3.3 安装项目依赖安装基础依赖使用-e参数以可编辑模式安装pip install -e .[metrics]常见问题解决方案下载超时添加--default-timeout1000参数依赖冲突先安装指定版本pip install torch2.1.2 torchvision0.16.2 torchaudio2.1.2CUDA兼容根据显卡驱动选择对应版本的PyTorch验证安装python -c import llama_factory; print(llama_factory.__version__)4. 运行与调试技巧4.1 启动Web界面基础启动命令llamafactory-cli webui高级参数示例根据硬件调整llamafactory-cli webui --port 8080 --listen --auto-devices --gpu-memory 16参数说明--port指定服务端口--listen允许局域网访问--auto-devices自动分配GPU内存--gpu-memory显存分配大小GB4.2 浏览器访问启动成功后终端会显示访问地址通常是http://127.0.0.1:7860。在Windows端可以直接用浏览器打开。如果无法访问检查WSL2网络配置cat /etc/resolv.conf确保nameserver设置正确4.3 模型下载配置在Web界面操作前建议先下载所需模型。创建模型存储目录mkdir -p ~/models/huggingface export HF_HOME~/models/huggingface使用huggingface-cli下载需先登录pip install huggingface-hub huggingface-cli login huggingface-cli download meta-llama/Llama-2-7b-chat-hf5. 性能优化与问题排查5.1 WSL2专用配置在Windows用户目录创建.wslconfig文件如C:\Users\用户名.wslconfig内容示例[wsl2] memory16GB processors8 localhostForwardingtrue重启WSL生效wsl --shutdown5.2 常见错误解决方案CUDA相关错误conda install cuda-toolkit -c nvidia export LD_LIBRARY_PATH/usr/local/cuda/lib64:$LD_LIBRARY_PATH端口冲突sudo lsof -i :7860 kill -9 PID显存不足尝试QLoRA等低资源微调方法调整--gpu-memory参数使用--cpu参数强制使用CPU不推荐5.3 自动化脚本示例创建启动脚本start_llama.sh#!/bin/bash conda activate llama_factory cd ~/ai_projects/LLaMA-Factory llamafactory-cli webui --port 8080 --listen --auto-devices添加执行权限chmod x start_llama.sh6. 进阶配置与扩展6.1 多模型管理技巧使用符号链接管理不同版本的模型ln -s ~/downloads/llama-2-7b ~/models/llama-2-7b6.2 后台运行与日志使用nohup保持服务运行nohup llamafactory-cli webui llama.log 21 查看实时日志tail -f llama.log6.3 外网访问配置如需从外部访问需在Windows防火墙放行对应端口并在路由器设置端口转发。安全提示生产环境务必配置身份验证避免直接暴露服务到公网7. 实际微调示例7.1 数据准备推荐格式JSON[ { instruction: 解释神经网络, input: , output: 神经网络是... } ]转换工具推荐pip install datasets python -c from datasets import load_dataset; dsload_dataset(json, data_filesdata.json)7.2 微调参数配置关键参数建议参数名推荐值说明per_device_train_batch_size2-4根据显存调整learning_rate1e-5初始学习率num_train_epochs3训练轮次lora_rank8LoRA矩阵秩save_steps500保存间隔7.3 监控与评估使用TensorBoard监控训练tensorboard --logdir runs/评估指标解读训练损失应平稳下降验证准确率反映泛化能力GPU利用率检查是否达到80%以上8. 环境备份与迁移8.1 Conda环境导出导出环境配置conda env export llama_factory_env.yaml在新机器恢复conda env create -f llama_factory_env.yaml8.2 项目打包技巧使用rsync同步开发环境rsync -avz ~/ai_projects usernew_host:~/ai_projects8.3 Docker化方案进阶创建Dockerfile示例FROM nvidia/cuda:12.1-base RUN apt update apt install -y python3-pip git RUN git clone https://github.com/hiyouga/LLaMA-Factory WORKDIR /LLaMA-Factory RUN pip install -e .[metrics] CMD [llamafactory-cli, webui]构建与运行docker build -t llama-factory . docker run --gpus all -p 7860:7860 llama-factory

相关新闻