VSCode + Ollama + Continue 本地 AI 代码助手 实操手册

发布时间:2026/6/8 6:53:47

VSCode + Ollama + Continue 本地 AI 代码助手 实操手册 目录VSCode Ollama Continue 本地 AI 代码助手 实操手册目录1. 前置环境准备必做1.1 硬件 系统要求1.2 基础依赖2. Ollama 安装 模型下载本地模型核心2.1 安装 Ollama2.2 基础命令终端执行PowerShell / CMD2.3 推荐模型下载适配 A770 16G 显存执行下载步骤补充 Ollama 常用管理命令3. VSCode 插件安装4. Continue 插件完整配置对接 Ollama4.1 打开配置文件4.2 替换配置内容适配 OllamaA770配置说明4.3 加载配置生效5. VSCode 命令面板全量常用命令 高频核心日常 90% 场景 代码编辑专用改代码 / 排错 配置 / 辅助命令6. 核心功能实操演示6.1 基础对话 代码问答6.2 选中代码局部改写6.3 切换运行模型7. 显卡 性能优化专属 A770 16G7.1 显存优化规则7.2 Ollama 性能调优可选7.3 VSCode 卡顿优化8. 常见报错 排查方案问题 1提示 model not found问题 2聊天面板无响应、一直加载问题 3能聊天但代码补全不生效问题 4网络代理导致连接失败9. 补充实用技巧9.1 自定义快捷键摆脱命令面板9.2 区分「本地模型」和「云端模型」9.3 缓存 模型清理完整使用流程速查精简版适用环境Windows 系统、Intel Arc A770 显卡、多 Python 环境、本地部署大模型 核心目标全程离线可用、本地 GPU 推理、代码问答 / 补全 / 改写、模型统一管理替代云端 AI兼顾隐私与速度。目录前置环境准备必做Ollama 安装 模型下载本地模型核心VSCode 插件安装Continue 插件完整配置对接 OllamaVSCode 命令面板常用操作CtrlShiftP核心功能实操演示显卡 / 性能优化针对 A770常见报错排查补充实用技巧1. 前置环境准备必做1.1 硬件 系统要求系统Windows 10 / Windows 11显卡Intel Arc A77016G 显存本手册针对性优化网络仅下载模型时需要联网日常使用可完全离线1.2 基础依赖确保系统正常开启显卡硬件加速显卡驱动更新至最新版关闭系统代理 / 全局代理避免 Ollama 本地接口访问失败记录本地默认端口Ollama 默认服务地址http://localhost:11434全程固定2. Ollama 安装 模型下载本地模型核心Ollama 作用本地模型管理器 推理服务负责下载、加载、运行大模型VSCode/Continue 仅作为前端调用接口。2.1 安装 Ollama官网下载https://ollama.com/ 选择 Windows 版本安装包双击安装全程默认路径下一步即可无需自定义配置安装完成后系统会自动后台启动Ollama Service开机自启2.2 基础命令终端执行PowerShell / CMD打开任意终端执行以下命令先验证安装成功# 查看Ollama版本验证是否正常运行 ollama --version正常输出版本号即安装成功。2.3 推荐模型下载适配 A770 16G 显存优先选择代码专用、量化版兼顾速度与显存占用按优先级推荐模型名称特点显存占用执行下载命令qwen2.5-coder:7b-instruct-q4_K_M中文友好、代码能力强、综合首选~6GBollama pull qwen2.5-coder:7b-instruct-q4_K_Mdeepseek-coder:6.7b-instruct-q4_K_M纯代码专项模型逻辑极强~5GBollama pull deepseek-coder:6.7b-instruct-q4_K_M执行下载步骤复制上面任意一条命令粘贴到终端回车等待下载完成速度取决于网络大文件耐心等待下载完成后查看本地已安装模型ollama list列表中出现刚下载的模型名称代表就绪。补充 Ollama 常用管理命令# 查看当前正在运行的模型是否占用GPU ollama ps # 停止正在运行的模型 ollama stop 模型名 # 删除本地模型释放硬盘空间 ollama rm 模型名 # 直接在终端运行模型临时聊天测试 ollama run 模型名重要提醒Continue不会自动下载模型必须手动用ollama pull下载后VSCode 才能调用。3. VSCode 插件安装打开 VSCode左侧点击「扩展」图标四个方块搜索并安装以下 2 个插件Continue作者Continue Dev, Inc核心插件对接本地 Ollama、实现代码聊天 / 改写 / 补全可选补充Ollama作者Ekbana Solutions简易版 Ollama 可视化管理新手可装非必需安装完成后重启一次 VSCode。4. Continue 插件完整配置对接 Ollama4.1 打开配置文件方式 1命令面板推荐按下快捷键Ctrl Shift P调出命令面板输入并选择Continue: Open Config自动打开config.yaml配置文件4.2 替换配置内容适配 OllamaA770清空原有内容完整复制下方配置粘贴无需修改路径默认本地 Ollama 接口version: 0.2.29 models: - name: qwen2.5-coder:7b-instruct-q4_K_M provider: ollama model: qwen2.5-coder:7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 contextLength: 8192 maxTokens: 2048 temperature: 0.1 - name: deepseek-coder:6.7b-instruct-q4_K_M provider: ollama model: deepseek-coder:6.7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 contextLength: 8192 maxTokens: 2048 temperature: 0.1 tabAutocompleteModel: name: deepseek-coder:6.7b-instruct-q4_K_M provider: ollama model: deepseek-coder:6.7b-instruct-q4_K_M apiBase: http://localhost:11434/v1 systemMessage: 你是专业的代码助手基于本地模型运行专注解答编程问题、优化代码、排查BUG使用中文回复。配置说明provider: ollama指定使用本地 Ollama 服务非云端apiBase固定本地接口不要修改temperature: 0.1降低随机性代码输出更严谨两个模型对应上一步下载的模型可按需增删4.3 加载配置生效保存config.yaml文件CtrlS命令面板CtrlShiftP执行Continue: Reload重载完成配置正式生效。5. VSCode 命令面板全量常用命令所有操作入口Ctrl Shift P输入关键词快速检索按使用频率分类 高频核心日常 90% 场景命令名称功能说明使用场景Continue: Toggle Chat打开 / 关闭 AI 聊天侧边栏提问、对话、解读代码Continue: Select Model切换本地模型在 qwen/deepseek 之间切换Continue: Reload重载插件配置修改、模型卡顿、无响应时使用Continue: Focus Chat光标直接定位到聊天输入框纯键盘操作无需鼠标点击 代码编辑专用改代码 / 排错命令名称功能说明操作步骤Continue: Inline Edit行内代码改写选中代码 → 执行命令 → 输入修改需求Continue: Accept Diff接受 AI 的代码修改AI 给出代码差异后一键应用Continue: Reject Diff拒绝 AI 的代码修改不需要修改时撤销 配置 / 辅助命令命令名称功能说明Continue: Open Config打开config.yaml配置文件Continue: Toggle Autocomplete开关 AI 自动代码补全卡顿时可关闭6. 核心功能实操演示6.1 基础对话 代码问答CtrlShiftP→ 执行Continue: Toggle Chat打开右侧聊天面板底部输入框提问示例解释Python装饰器用法帮我排查这段代码的BUG发送后模型本地推理输出答案全程不上传网络6.2 选中代码局部改写在编辑器中选中一段代码CtrlShiftP→ 执行Continue: Inline Edit输入需求优化代码运行速度/添加详细注释AI 生成修改方案选择Accept Diff应用修改6.3 切换运行模型CtrlShiftP→ 执行Continue: Select Model在下拉列表选择已下载的模型名称切换后直接使用无需重载插件7. 显卡 性能优化专属 A770 16G7.1 显存优化规则禁止使用 30B/70B 超大模型会直接爆显存、卡顿、闪退优先使用q4_K_M量化版本平衡速度与精度同时只运行一个模型不要多模型并发7.2 Ollama 性能调优可选右键开始菜单 → 运行 → 输入services.msc回车找到Ollama Service右键属性 → 启动类型保持「自动」若运行卡顿终端执行ollama ps查看占用执行ollama stop 模型名释放显存7.3 VSCode 卡顿优化模型响应慢执行Continue: Reload重载插件自动补全拖慢编辑器执行Continue: Toggle Autocomplete关闭补全功能8. 常见报错 排查方案问题 1提示model not found原因本地未下载对应模型解决终端执行ollama pull 模型名下载完成后重载 Continue问题 2聊天面板无响应、一直加载原因 1Ollama 服务未启动 解决重启电脑或在服务中手动启动Ollama Service原因 2接口地址错误 解决检查config.yaml中apiBase必须为http://localhost:11434/v1原因 3模型卡死 解决终端ollama stop 模型名再Continue: Reload问题 3能聊天但代码补全不生效原因tabAutocompleteModel 配置错误解决核对配置文件中补全模型名称和本地ollama list保持一致问题 4网络代理导致连接失败解决关闭系统全局代理、VPNOllama 本地接口不需要外网9. 补充实用技巧9.1 自定义快捷键摆脱命令面板VSCode 快捷键Ctrl K Ctrl S打开键盘快捷方式右上角打开JSON配置文件添加以下配置示例可自定义按键{ key: altz, command: continue.toggleChat }, { key: altx, command: continue.selectModel }, { key: altc, command: continue.inlineEdit }保存后AltZ打开聊天、AltX切换模型纯键盘操作更高效。9.2 区分「本地模型」和「云端模型」本方案OllamaContinue →纯本地推理离线可用、数据不外泄VSCode 自带code chat/ Copilot → 云端模型必须联网两套功能互不冲突按需选择使用。9.3 缓存 模型清理清理 Ollama 模型ollama rm 模型名删除不用的模型释放硬盘模型异常重置先ollama stop all再重启 VSCode完整使用流程速查精简版开机 → Ollama 服务自动启动终端确认模型ollama list打开 VSCode →CtrlShiftP选择功能问答Continue: Toggle Chat改代码选中代码 →Continue: Inline Edit换模型Continue: Select Model出问题优先执行Continue: Reload

相关新闻