
玩到训练lora这一步了我使用了网上的别人的秋叶训练器但是出现了各种各样的问题....于是自己从源码安装算了...github下载源码秋叶大佬把源码发布到github上面了直接下载下来就行Akegarasu/lora-scripts: SD-Trainer. LoRA Dreambooth training scripts GUI use kohya-sss trainer, for diffusion model.https://github.com/Akegarasu/lora-scripts按照介绍的方法就可以安装不过上面写的不是很详细我搞了好久才搞定看起来挺简单运行两个文件而已设置powerShell权限那两个.ps1文件是要使用powerShell打开的其实就是跟cmd差不多的东东权限高一点我们先设置权限才能打开现在开始菜单右键管理员身份打开powershell输入下面命令Set-ExecutionPolicy RemoteSigned打开install-cn.ps1这个是安装文件不过我运行的时候出了点问题我们先看一下他到底写了什么查了我好久..小白真累先看上面三个重点红框$Env:PIP_INDEX_URL https://pypi.tuna.tsinghua.edu.cn/simplepython -m venv venv.\venv\Scripts\activate主要是这三个就是设置清华镜像源方便pip安装创建并且进入虚拟环境而且检测python版本是不是3.10看到这里应该知道我上次为啥换python版本了吧....我还特意查资料写了一篇关于python虚拟环境vent的文章.....这些看着很眼熟吧其实就是再虚拟环境里面安装各种依赖还有安装requirtments.txt里面的依赖库当然这里是我改过的我没有按照秋叶的推荐安装整理一下思路这里其实就是创建虚拟环境并且安装依赖库如果你运行成功之后就会出现一个venv的文件夹这就是创建的虚拟环境知道了思路甚至可以不用运行这个自己都可以手动不过还是偷懒吧偷偷改一下里面的东西把自己想安装的装进去就行根据报错需要啥安装啥顺便给你们看一下源文件是这样的我改了一下需要的东西...因为不装那些我的xformers会有问题...打开run_gui.ps1老规矩看看这个有什么重点这两个$Env:HF_HOME huggingfacepython gui.py一个是设置huggingface缓存位置反正就在这个文件夹里第二个就是用python运行gui.py就是界面文件其他的if什么的都是判断有没有虚拟环境python那些....不用管只要前面安装好了就行打开gui.py为什么要打开这个因为这里面有一个很重要的东西后面会讲到先记住就行准备条件1.python3.10我是用了pyenv-win版本管理切换2.根据自己的需求更改虚拟环境的依赖库内容修改install-cn.ps13.提前下好自己需要的wheel文件flash-attn,triton主要就是torch和xformers还有需要的某些官方镜像都没有的轮子文件大佬自制的,可以自己找我之前写过的文章修改install-cn.ps1其实这一部分就是在安装torch以及xformers我是用了我之前试过的可以匹配的版本懒得自己再去编译了而且自己编译的有小bugxformers v0.0.30 torch2.7.0cu128这个匹配50系应该是没问题的然后就是flash-attn以及triton这两个得去下载大佬自制的windows版本官方只有linux版本所以这两个不知道怎么下看我之前文章下载完轮子文件直接在文件里面加入你要安装的就行我的是这样的你们看着修改看你们想装什么版本只要xformers能用就行这里再说一句xformers很重要不然训练超级慢而且可能爆显存我试过...$install_torch Read-Host 是否需要安装 Torchxformers? [y/n] (默认为 y) if ($install_torch -eq y -or $install_torch -eq Y -or $install_torch -eq ) { python -m pip install torch2.7.0cu128 torchvision torchaudio -f https://mirrors.aliyun.com/pytorch-wheels/cu128 Check torch 安装失败请删除 venv 文件夹后重新运行。 python -m pip install -U -I --no-deps xformers0.0.30 -f https://mirrors.aliyun.com/pytorch-wheels/cu128 Check xformers 安装失败。 python -m pip install D:\wheel\flash_attn-2.8.2cu128torch2.7.0cxx11abiFALSE-cp310-cp310-win_amd64.whl Check flash_attn 安装失败 python -m pip install D:\wheel\triton_windows-3.4.0.post21-cp310-cp310-win_amd64.whl Check triton_windows 安装失败 }至于requirments文件最好按照秋叶大佬的配置来有需要再修改文件内容就是里面的版本然后直接右键powershell运行即可会弹出来一个cmd根据里面提示显示安装成功就是成功了运行run_gui.ps1如果安装成功了那么运行这个就是没什么问题了他会自动在你的默认浏览器弹出来我们看一下cmd的内容这里面会显示你的python版本上面的error显示连接网络错误谷歌没有魔法懂得吧然后就是占用的端口是28000然后就可以开始我们的lora训练了TensorBoard图表这里秋叶大佬整合了TensorBoard功能但是你们会发现他使用不了打开是没有数据当然我们要先整理一下逻辑首先要有数据说明我们得先训练一个lora出来训练过程的loss学习率等曲线会记录在log日志然后你还会发现他还是没有数据.....看上图你就会发现路径位置是logs....这是秋叶大佬设置的默认路径所以我们得更改一下到我们存放训练日志的路径就是上面说的gui.py打开找到30行把那个参数logs修改为自己的位置catch_exception def run_tensorboard(): log.info(Starting tensorboard...) subprocess.Popen([sys.executable, -m, tensorboard.main, --logdir, E:\ComfyUI_Mie_V6.0\lora-train\Tachibana Kanade\logs, --host, args.tensorboard_host, --port, str(args.tensorboard_port)])然后重新启动就行了然后就可以开始你的lora训练咯图片裁剪网站推荐一个可以批量裁剪的网站BIRME - Bulk Image Resizing Made Easy (Online Free)