Qwen3.5-2B微调保姆级教程（非常详细），LoRA实战从入门到精通，收藏这一篇就够了！-尧图网站设计

本文将完整带你走通通义千问3.5-2B模型的LoRA微调全流程代码可直接复制运行适合新手入门大模型微调消费级显卡。一、项目概述与环境准备**1.**项目目标我们将使用**LoRA****Low-Rank Adaptation**技术对Qwen/Qwen3.5-2B进行轻量级微调在保留模型通用能力的同时让它适配特定任务如对话、知识问答。**2.**核心依赖安装# 安装核心依赖 pip install -q transformers datasets peft accelerate bitsandbytes torch sentencepiece**3.**关键库说明•transformers: 加载模型与Tokenizer•peft: 实现LoRA微调•bitsandbytes: 4/8位量化节省显存•accelerate: 分布式训练加速•datasets: 处理自定义数据集二、加载模型与****Tokenizer**1.**加载量化模型import torch from transformers import ( AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig, ) # 4位量化配置 bnb_config BitsAndBytesConfig( load_in_4bitTrue, bnb_4bit_use_double_quantTrue, bnb_4bit_quant_typenf4, bnb_4bit_compute_dtypetorch.bfloat16 ) model_name Qwen/Qwen3.5-2B # 加载模型 model AutoModelForCausalLM.from_pretrained( model_name, quantization_configbnb_config, device_mapauto, trust_remote_codeTrue ) # 加载Tokenizer tokenizer AutoTokenizer.from_pretrained(model_name, trust_remote_codeTrue) tokenizer.pad_token tokenizer.eos_token tokenizer.padding_side right**2.**测试模型基础能力# 简单测试 prompt 你好介绍一下你自己。 inputs tokenizer(prompt, return_tensorspt).to(cuda) outputs model.generate( **inputs, max_new_tokens200, temperature0.7, do_sampleTrue ) print(tokenizer.decode(outputs[0], skip_special_tokensTrue))三、准备自定义数据集**1.**数据集格式我们使用对话格式数据集也可以通过大模型输出结构化数据结构的数据集示例如下[ { instruction: 请解释什么是LoRA微调, input: , output: LoRALow-Rank Adaptation是一种轻量级微调技术通过在模型Transformer层插入低秩矩阵仅训练少量参数即可适配新任务大幅降低显存占用和训练成本。 }, { instruction: 写一段关于春天的短句, input: , output: 春风拂过柳丝轻摇暖阳洒在刚冒芽的青草上万物都在温柔地苏醒。 } ]**2.**加载与预处理数据集from datasets import load_dataset # 加载本地JSON数据集替换为你的文件路径 dataset load_dataset(json, data_filescustom_data.json) # 数据格式化函数 def format_prompt(sample): return f|im_start|user {sample[instruction]} {sample[input]}|im_end| |im_start|assistant {sample[output]}|im_end| # 应用格式化 dataset dataset.map(lambda x: {text: format_prompt(x)})**3.**划分训练集与测试集dataset dataset[train].train_test_split(test_size0.1) train_dataset dataset[train] eval_dataset dataset[test]四、Tokenizer数据处理def tokenize_function(examples): return tokenizer( examples[text], truncationTrue, max_length512, paddingmax_length ) # 对数据集进行Token化 tokenized_train train_dataset.map(tokenize_function, batchedTrue, remove_columns[text]) tokenized_eval eval_dataset.map(tokenize_function, batchedTrue, remove_columns[text]) # 设置标签与输入ID一致用于语言建模 tokenized_train.set_format(torch, columns[input_ids, attention_mask, labels]) tokenized_eval.set_format(torch, columns[input_ids, attention_mask, labels]) tokenized_train tokenized_train.map(lambda x: {labels: x[input_ids]}) tokenized_eval tokenized_eval.map(lambda x: {labels: x[input_ids]})五、LoRA微调配置from peft import LoraConfig, get_peft_model lora_config LoraConfig( r8, # 秩 lora_alpha32, # 缩放因子alpha 一般设置为 r 的 4 倍 target_modules[q_proj, v_proj], # 目标模块 lora_dropout0.05, biasnone, task_typeCAUSAL_LM ) # 包装模型为LoRA模型 model get_peft_model(model, lora_config) model.print_trainable_parameters() # 查看可训练参数比例参数含义1. r8 → 秩Rank 通俗意思 LoRA 矩阵的大小决定你训练多少新知识作用 LoRA 不训练全模型只训练两个小矩阵 r 就是这两个小矩阵的 “宽度” r 越大 → 学的越多 → 占显存越大 → 训练越慢 r 越小 → 学的越少 → 轻量化、快、稳常用值轻量对话4, 8推荐复杂任务16, 32, 64 新手建议直接用 r8 最稳、最快、最省显存 2. lora_alpha32 → 缩放因子Scaling 通俗意思 LoRA 学习强度学习力度旋钮作用控制 LoRA 权重对原模型的影响强度 alpha 越大 → LoRA 影响越强 alpha 越小 → 越柔和经验规则非常重要 alpha 一般设置为 r 的 4 倍 r8 → alpha32 r16 → alpha64 r4 → alpha16 新手建议跟着 r 走就行不用乱改 3. target_modules[q_proj, v_proj] → 训练目标模块通俗意思你要对模型的哪些 “神经层” 动手微调作用 Transformer 里最重要的层是 q_proj k_proj v_proj out_proj / o_proj 为什么常用 q_proj, v_proj 因为这两个层效果最好、最稳定、训练最快几乎所有开源模型LLaMA、Qwen、GLM都用这两个。想更强可以全开 target_modules[q_proj, k_proj, v_proj, o_proj] 新手建议默认 q_proj v_proj 足够用 4. lora_dropout0.05 → 随机失活通俗意思防止过拟合防止模型死记硬背训练集作用训练时随机 “关掉” 5% 的 LoRA 神经元让模型更健壮、不背答案。常用值 0.05 ~ 0.1 新手建议 0.05 最稳不用改 5. biasnone → 偏置项是否训练通俗意思是否训练模型里很小的偏置参数基本没用三个选项 none不训练最快、最常用 all全部训练没必要 lora_only只训练 LoRA 相关的 bias 新手建议直接用 none 6. task_typeCAUSAL_LM → 任务类型通俗意思告诉 PEFT 你在做什么任务任务类型 CAUSAL_LM因果语言模型对话、续写、聊天 SEQ_2_SEQ_LM翻译、摘要 TOKEN_CLS分类 QUESTION_ANS问答我们微调 Qwen 对话模型 → 必须用 CAUSAL_LM超简记忆口诀新手必背r8 → 学多少alpha32→ 学习力度q_proj, v_proj → 微调核心层dropout0.05→ 防止过拟合biasnone→ 不动小参数CAUSAL_LM→ 对话任务六、设置训练参数并启动训练from transformers import TrainingArguments, Trainer, DataCollatorForLanguageModeling training_args TrainingArguments( output_dir./qwen3.5-2b-lora, per_device_train_batch_size4, gradient_accumulation_steps4, learning_rate2e-4, num_train_epochs3, logging_steps10, evaluation_strategyepoch, save_strategyepoch, fp16True, optimpaged_adamw_8bit, report_tonone ) data_collator DataCollatorForLanguageModeling( tokenizertokenizer, mlmFalse ) trainer Trainer( modelmodel, argstraining_args, train_datasettokenized_train, eval_datasettokenized_eval, data_collatordata_collator ) # 开始训练 trainer.train()七、保存与加载微调后的模型1.保存LoRA****适配器model.save_pretrained(./qwen3.5-2b-lora-final) tokenizer.save_pretrained(./qwen3.5-2b-lora-final)**2.**加载微调后模型并推理from peft import PeftModel, PeftConfig peft_config PeftConfig.from_pretrained(./qwen3.5-2b-lora-final) base_model AutoModelForCausalLM.from_pretrained( peft_config.base_model_name_or_path, quantization_configbnb_config, device_mapauto, trust_remote_codeTrue ) fine_tuned_model PeftModel.from_pretrained(base_model, ./qwen3.5-2b-lora-final) # 测试微调效果 prompt |im_start|user\n请解释什么是LoRA微调|im_end|\n|im_start|assistant\n inputs tokenizer(prompt, return_tensorspt).to(cuda) outputs fine_tuned_model.generate( **inputs, max_new_tokens300, temperature0.7, do_sampleTrue ) print(tokenizer.decode(outputs[0], skip_special_tokensTrue))八、下一步计划与总结**1.**下一步优化方向•调整LoRA参数r、alpha提升效果•尝试更大的数据集或多轮训练•结合RLHF进一步对齐人类偏好•部署为API服务或Web应用**2.**核心总结✅LoRA****优势仅训练~0.1%参数显存占用低训练速度快✅量化关键4位量化让2B模型在单张消费级GPU上即可微调✅流程闭环从数据准备到模型推理完整覆盖大模型微调全链路学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

Qwen3.5-2B微调保姆级教程（非常详细），LoRA实战从入门到精通，收藏这一篇就够了！

相关新闻

200元最好用的头戴式耳机是哪款？2026平价头戴式耳机排行榜10强品牌

避坑指南：在树莓派5上跑Frigate监控，这几个配置细节没做好容易卡顿

STM32与华为云IoT的智能浇花系统设计

Linux IIO传感器驱动开发实战：从框架原理到SPI驱动实现

CLI脚手架工具discli：自动化项目初始化与团队开发规范管理

【架构实战】百万级Excel数据导入的“坑”与“填坑”指南（上）：痛点剖析与破局利器 EasyExcel

Arm Neoverse CMN-650架构解析与高性能计算应用

RunawayContext：大语言模型复杂任务分解与上下文管理框架解析

OpenClaw AVP：构建统一音视频协议栈，实现多协议流媒体处理

终极UE5项目版本控制指南：让大型游戏项目协作提速50%的完整方案

从IMU到UWB：拆解美国队长盾牌自主归位的嵌入式控制核心

5大革新点解析：Faze4六轴机械臂从开源设计到工业级应用的实战指南

贾子竞争哲学与文明范式革命：让对手失去存在的意义

【斯普林格Springer 旗下的Atlantis Press出版社出版 | EI Compendex、Scopus、谷歌学术】第五届区块链、信息技术与智慧经济国际学术会议（ICBIS 2026）

AI 范式文明依附与贾子理论的破局价值：技术主权视角下的中美 AI 竞争伪命题批判

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程