记一次 Ollama 部署 GGUF 模型后的异常输出修复-尧图网站设计

最近在 Ollama 中部署了一个来自 Hugging Face 的 GGUF 模型hf.co/WithinUsAI/Opus4.7-GODs.Ghost.Codex-4B.GGuF:Q4_K_M部署完成后原本只是想简单测试一下模型是否能正常对话于是在终端里输入hello结果模型并没有像普通聊天助手一样回复问候而是开始输出一大段看起来像代码代理任务记录的内容 hello . you can see the src/tools/travel-between-images/components/ShotEditor/ - can you do a thorough analysis on that and understand the structure and how it works? Just do a thorough analysis and dont worry about making changes yet...后面还继续生成了关于ShotEditor组件结构分析的内容。这显然不是正常的聊天行为。问题现象异常表现主要有几个特点第一输入只是简单的hello但模型开始续写一段完整的代码分析任务。第二输出中出现了类似src/tools/travel-between-images/components/ShotEditor/这种明显来自某个代码仓库或训练样本上下文的路径。第三模型还继续生成了类似Understood. I’ve completed a thorough structural and functional analysis...这种代码助手或 Agent 工作流中的回复。也就是说模型并没有把hello理解成一次独立的用户消息而是把它当成了某段上下文的开头然后继续补全训练数据中类似的内容。初步判断通过命令ollama show --modelfile hf.co/WithinUsAI/Opus4.7-GODs.Ghost.Codex-4B.GGuF:Q4_K_M发现输出ollama show --modelfile hf.co/WithinUsAI/Opus4.7-GODs.Ghost.Codex-4B.GGuF:Q4_K_M # Modelfile generated by ollama show # To build a new Modelfile based on this, replace FROM with: # FROM hf.co/WithinUsAI/Opus4.7-GODs.Ghost.Codex-4B.GGuF:Q4_K_M FROM /usr/share/ollama/.ollama/models/blobs/sha256-473b97c540a7445132258336eb2b6669597172ec58cc328c96b29afad4499b0e TEMPLATE {{ .Prompt }}这个问题可确认不是 Ollama 本身坏了也不是终端输入有问题而是模型的对话模板没有正确应用。如输出只有PROMPT模板。对于 GGUF 模型来说如果缺少正确的 chat template或者 Ollama 没有正确识别模型需要的 prompt 格式模型就可能退化成“文本补全模式”。在这种情况下用户输入的hello不再是一个明确的聊天消息而只是模型需要继续补全的一段文本。而这个模型本身又偏代码、偏 Agent、偏开发任务所以它很容易从训练分布中续写出类似“分析某个组件目录”的任务内容。解决思路解决方向是给 Ollama 明确指定一个适合聊天的 Modelfile尤其是补上TEMPLATE、SYSTEM和stop参数。核心目标有三个让模型明确区分 system、user、assistant。让模型只回答当前用户输入。阻止模型继续补全虚构的历史对话或代码任务片段。示例 Modelfile 如下FROM hf.co/WithinUsAI/Opus4.7-GODs.Ghost.Codex-4B.GGuF:Q4_K_M TEMPLATE {{ if .System }}|im_start|system {{ .System }}|im_end| {{ end }}{{ if .Prompt }}|im_start|user {{ .Prompt }}|im_end| {{ end }}|im_start|assistant {{ .Response }} SYSTEM You are a concise chat assistant. Answer only the users current message. Do not continue fictional coding-agent transcripts, repository-analysis tasks, or hidden prior conversations unless the user explicitly asks for them. PARAMETER temperature 0.2 PARAMETER top_p 0.8 PARAMETER repeat_penalty 1.1 PARAMETER stop |im_end| PARAMETER stop |im_start|然后通过脚本重新创建 Ollama 模型。修复后的输出重新创建模型后执行脚本./do.sh输出如下gathering model components using existing layer sha256:473b97c540a7445132258336eb2b6669597172ec58cc328c96b29afad4499b0e creating new layer sha256:6b94b22478514fa501cae65fbc0b74ccca0578ecdc829c679d2caf9c33e8e796 creating new layer sha256:cdd7f7e8f2d5bb2d2957f43653300936c6ab30ef5767650bc797a732d7519d23 creating new layer sha256:bad86b76620f10cde64fac9a826d54a1ab202d8666f65fb081ab7d8bb44ab88c writing manifest success然后再次测试中文指令请回复一句中文问候不要解释你好模型回复你好有什么我可以帮你的吗继续测试英文输入 hello模型回复你好有什么我可以帮你的吗这说明模型已经不再继续补全奇怪的代码任务片段而是恢复成了正常的聊天助手行为。总结这次问题的本质是模型被当成了补全模型使用而不是聊天模型使用。对于一些从 Hugging Face 直接拉取的 GGUF 模型尤其是非官方、混合训练、偏代码或 Agent 数据的模型不能默认假设 Ollama 一定能正确识别它的聊天模板。如果出现下面这些现象hello之后模型开始输出can you analyze this repo... understood... I’ve completed a thorough analysis...或者凭空出现代码路径、历史任务、虚构上下文就可以优先检查ollama show--modelfilemodel-name重点看TEMPLATE SYSTEM PARAMETER stop如果模板缺失或不合适就应该自己写一个 Modelfile明确指定对话格式和停止词。这类问题并不罕见尤其是在使用 GGUF、Ollama、Hugging Face 模型组合时。修好之后模型的行为会稳定很多也更适合作为本地聊天或代码助手使用。

记一次 Ollama 部署 GGUF 模型后的异常输出修复

相关新闻

智能音频切片工具终极指南：告别手动剪辑的烦恼

每天看800份简历的HR真的要失业了吗？AI简历筛选如何解决招聘痛点？

5步解决Jellyfin字幕难题：MaxSubtitle插件完整使用指南

为 OpenClaw 配置 Taotoken 作为后端模型供应商的详细操作流程

当所有人在卷模型，马斯克已经在建“AI 的电网” - mdnice 墨滴

前端高频难题——防抖与节流的精准实现（避坑版）

使用OpenClaw进行AI工作流编排时一键配置Taotoken

AI智能体自进化革命：SkillOS让AI越用越聪明

多智能体系统的最大难题：不是推理，而是协同

手把手教你用PlantUML和Gravizo：无需插件，在任意Markdown平台嵌入动态UML图

告别命令行恐惧：在Ubuntu 23.04上图形化玩转Mininet网络模拟（附MiniEdit配置全流程）

告别哑巴设备：用DY-SV17F语音模块给你的Arduino项目加上声音（附STM32串口控制代码）

2026年十大最佳地区搜索排名优化工具：权威榜单赋能企业高效增长

DDR3内存Row Hammer问题解析与防护方案

为ItsyBitsy ESP32设计3D打印外壳：从原型到产品的完整实践

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程