openclaw生态Nunchaku FLUX.1-dev:GPU利用率监控与性能瓶颈分析

发布时间:2026/5/20 20:28:10

openclaw生态Nunchaku FLUX.1-dev:GPU利用率监控与性能瓶颈分析 ComfyUI 中 Nunchaku FLUX.1-dev 模型文生图使用手册1. 环境准备使用 Nunchaku FLUX.1-dev 模型前需要确保系统满足以下基础环境要求硬件要求NVIDIA 显卡支持 CUDA推荐显存 24GB 以上显存不足可选择 FP8 量化版模型软件要求Python 3.10 或更高版本Git 环境PyTorch 对应版本需匹配系统和显卡工具准备安装huggingface_hub工具用于模型下载pip install --upgrade huggingface_hub2. 插件安装与部署2.1 安装 ComfyUI-nunchaku 插件提供两种安装方法可根据需求选择方法 A使用 Comfy-CLI推荐# 安装ComfyUI CLI工具 pip install comfy-cli # 安装ComfyUI已安装可跳过 comfy install # 安装Nunchaku插件 comfy noderegistry-install ComfyUI-nunchaku # 移动插件到正确目录 mv ComfyUI-nunchaku ComfyUI/custom_nodes/nunchaku_nodes方法 B手动安装# 1. 安装ComfyUI git clone https://github.com/comfyanonymous/ComfyUI.git cd ComfyUI pip install -r requirements.txt # 2. 克隆Nunchaku插件 cd custom_nodes git clone https://github.com/mit-han-lab/ComfyUI-nunchaku nunchaku_nodes2.2 安装 Nunchaku 后端从 v0.3.2 版本开始可以通过install_wheel.json一键安装或更新后端 wheel 包。3. 模型准备与配置3.1 配置工作流将示例工作流复制到 ComfyUI 指定目录# 进入ComfyUI根目录 cd ComfyUI # 创建工作流目录 mkdir -p user/default/example_workflows # 复制示例工作流 cp custom_nodes/nunchaku_nodes/example_workflows/* user/default/example_workflows/3.2 下载模型文件需要下载基础 FLUX 模型和 Nunchaku FLUX.1-dev 专属模型基础 FLUX 模型必装# 文本编码器模型 hf download comfyanonymous/flux_text_encoders clip_l.safetensors --local-dir models/text_encoders hf download comfyanonymous/flux_text_encoders t5xxl_fp16.safetensors --local-dir models/text_encoders # VAE模型 hf download black-forest-labs/FLUX.1-schnell ae.safetensors --local-dir models/vaeNunchaku FLUX.1-dev 模型# INT4版本主模型 hf download nunchaku-tech/nunchaku-flux.1-dev svdq-int4_r32-flux.1-dev.safetensors --local-dir models/unet/ # 可选LoRA模型如FLUX.1-Turbo-Alpha # 存放至models/loras目录4. 运行文生图工作流4.1 启动 ComfyUI在 ComfyUI 根目录执行python main.py启动后在浏览器打开本地地址进入 ComfyUI 网页端。4.2 加载工作流在网页端加载nunchaku-flux.1-dev.json工作流该工作流支持多 LoRA文生图效果最佳4.3 参数设置与生成在提示词输入框输入英文描述示例A beautiful landscape with mountains and lakes, ultra HD, realistic, 8K调整参数推理步数分辨率LoRA 权重采样器点击运行按钮开始生成图片5. 注意事项模型目录主模型models/unet/LoRAmodels/loras文本编码器models/text_encodersVAEmodels/vae显存适配FP16 版约 33GB 显存FP8 版约 17GB 显存INT4/FP4 版显存占用更低显卡兼容Blackwell 显卡仅支持 FP4 模型其他 NVIDIA 显卡优先使用 INT4 模型推理步数关闭FLUX.1-Turbo-AlphaLoRA 时步数不低于 20获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关新闻