)
1.API 详解Ollama对客户端相关的命令也提供API操作的接口方便在企业应用中通过程序类操作私有大模型。1.1Apifox介绍与安装Apifox 是一款集成了 API 文档、API 调试、API Mock、API 自动化测试于一体的协同工作平台。它的目标是成为 API 开发、测试、运维整个生命周期中的“一站式”解决方案。说白了就是一个API的“全能工作台”。具体内容可以查看apifox的帮助文档帮助中心 - Apifox 帮助文档Apifox的安装就是点开官网找到自己的系统对应的版本就行Apifox提供了桌面客户端和Web版两种方式你可以按需选择选择方案优点适合人群桌面版(推荐)功能最完整、性能最佳支持离线工作和丰富的环境配置。所有用户尤其是需要深度使用和高效工作的开发者。Web版免安装有浏览器就能用方便快捷。偶尔使用、或无法安装软件的临时场景。访问官网https://www.apifox.cn或者直接去官网的下载页面按照自己的操作系统选择对应版本就行Windows选择 Windows 版本下载Apifox-windows-latest.exe安装包约 187MB。macOS根据你的Mac芯片Intel 或 Apple M1/M2选择对应的.dmg安装包。Linux选择.AppImage或.tar.gz格式的安装包。下载完安装包后双击默认下一步目标文件夹可以自己找一个盘放(尽量不是C盘)1.2导入Apifox文档为了方便后续使用程序接入Ollama中的大模型在此可以先通过Apifox进行Api的快速体验与学习。 《Ollama.apifox.json》文件提供了供Apifox软件导入的json内容再此我们先导入到Apifox软件中快速体验一下API相关功能Apifox不只能读取JSON文件。Step 1打开导入项目Step 2选择导入的文件Step 3输入项目名称将《Ollama.apifox.json》文件导入创建项目名称1.3 配置环境地址Oallma支持的API可以在API 参考文档 -- Ollama 中文文档|Ollama官方文档了解详解双击打开查看配置测试环境地址IP 地址 酒店的地址127.0.0.1是一个特殊地址它不指向外部街道而是指向酒店的“自我中心控制室”。无论谁从楼里哪个房间往127.0.0.1发消息消息都只在酒店内绕一圈绝不走到大街上。端口号 酒店里的房间号11434就是第 11434 号房间。每个房间端口只能住一个服务比如 Ollama、MySQL、Nginx 等。房间门上会清楚写着这个房间是干什么的服务协议但房间号本身只是编号不负责开门那是操作系统的活。http://127.0.0.1:11434 完整的房间寻址指令意思就是“去自我中心控制室127.0.0.1找到 11434 号房间然后用 HTTP 协议跟里面的人服务说话。”1.4 聊天对话接口说明聊天对话接口是实现类似ChatGPT、豆包、deepseek等网页对话功能的关键接口请求的地址与参数如下POST /api/chat{model: qwen2.5:0.5b,messages: [{role: string,content: string,images: string}],format: string,stream: true}具体的请求参数可以看文档预览 Ollama API 请求参数① 基础对话参数每次请求几乎必填参数名 (位置:body)类型必选️ 大白话解释 示例 / 取值范围 小贴士modelstring✅ 是你想跟哪个模型聊天llama3.2,qwen2.5,deepseek-r1:7b先用ollama list看你电脑上装了哪些模型填一模一样的名字。messagesarray[object]✅ 是整个对话记录就像微信聊天记录一样。[{role:user,content:嗨}]数组里每个对象是一条消息按时间顺序从旧到新排列。↳rolestring✅ 是这句话是谁说的system系统指令,user你,assistantAIsystem用来给 AI 设定“人设”比如“你是一个懂 Linux 的专家”。↳contentstring✅ 是说话的具体内容。解释一下什么是端口支持纯文本也支持多模态图片配合images字段。↳imagesstring[]❌ 否你想让 AI “看”的图片。[iVBORw0KGgoAAAANSUhEUgAA...]图片需转为 base64 字符串不含data:image/前缀。② 生成控制参数调整回答的风格和长度参数名 (位置:body)类型必选️ 大白话解释 示例 / 取值范围 小贴士streamboolean❌ 否回答是一次性全部蹦出来还是一条一条往外冒false一次性,true流式流式体验更像 ChatGPT但 Apifox 里建议先设false方便看完整结果。keep_alivestring❌ 否模型这次聊完后在内存里再待多久才“下机”5m5分钟,1h,-1永不卸载,0立即卸频繁调用时设长一点如10m能加快响应内存紧张就设0。formatstring❌ 否强制 AI 按某种格式回答。json目前主要支持json会让模型输出合法的 JSON。stopstring[]❌ 否遇到这些词就立马停止生成别再说下去了。[\n, 用户, Observation:]常用语换行符\n、特定的结束标记。③ 高级生成参数藏在options对象里控制创造性和重复性参数名 (在options内)类型必选️ 大白话解释 取值范围默认值 小贴士temperaturenumber❌ 否回答的“脑洞”有多大。越高越放飞越低越老实。0 ~ 2默认 0.8讲段子用 1.2写代码用 0.2。top_pnumber❌ 否词库的“保守选区”。越低越只挑最稳的词。0 ~ 1默认 0.9和temperature二选一微调一般调temperature就够了。top_kinteger❌ 否每次只从可能性最高的前 K 个词里选。正整数默认 40值越小回答越单调越大则越容易选到生僻词。repeat_penaltynumber❌ 否重复说话的惩罚力度。1 会减少重复。0 ~ 2默认 1.1设成 1.2 能有效减少“车轱辘话”。repeat_last_ninteger❌ 否往前回顾多少 token 来检查重复。默认 640禁用-1全部上下文设小一点可以让模型不那么执着于复读刚说过的话。seedinteger❌ 否随机数种子。相同种子 相同参数 → 相同回答。随意如 42用于调试或复现某个结果。④ 扩展参数工具调用目前较高级参数名 (位置:body)类型必选️ 大白话解释 示例 小贴士toolsarray[object]❌ 否给 AI 一把“瑞士军刀”让它能查询天气、算数学等。[{type:function,function:{name:get_weather,...}}]需要模型支持如llama3.2及以上目前属于进阶玩法。还有一个简单方法直接自动生成修改时注意格式1.5 聊天对话示例自动合并就可以整条显示Apifox 接口名称️ Ollama CLI 命令 (原始层) Ollama REST API (接入层)核心API地址POST 聊天对话接口ollama run model_name或ollama run model_name prompt启动交互式对话POST /api/chathttp://127.0.0.1:11434/api/chatPOST 向量化接口需借助API或第三方库调用POST /api/embedhttp://127.0.0.1:11434/api/embedGET 查询运行中的模型列表ollama psGET /api/pshttp://127.0.0.1:11434/api/psGET 查询可用的模型列表ollama listGET /api/tagshttp://127.0.0.1:11434/api/tagsPOST 拉取模型ollama pull model_namePOST /api/pullhttp://127.0.0.1:11434/api/pullDEL 删除模型ollama rm model_nameDELETE /api/deletehttp://127.0.0.1:11434/api/delete2. Ollama快速搭建ChatBot2.1 ChatBox是什么ChatBox是一款多平台支持的AI客户端软件凭借其强大的功能、简洁的界面设计以及对用户隐私的高度重视迅速成为办公学习领域的热门工具。ChatBox不仅仅是一个简单的AI聊天工具它是一款功能丰富、适用于多种场景的智能AI助手涵盖从日常办公到专业开发的广泛需求。核心功能全平台支持ChatBox支持Windows、MacOS、Linux、Android、iOS以及网页版用户可以在任何设备上无缝切换使用实现跨平台数据同步。智能文档与图片交互支持与各类文档包括PDF文件、Word文档、Excel表格、TXT文本和图片进行智能交互AI可以理解内容并提供智能分析和响应。AI编程助手提供智能代码生成与预览、代码审查与重构建议、程序调试与安全检查等功能支持多种编程语言。实时联网搜索通过AI联网搜索功能帮助用户获取最新的事实、新闻和数据支持URL分析、内容摘要以及事实核查。AI生成的图表与可视化能够生成清晰、可定制的图表帮助用户理解复杂的概念和数据。图像生成与渲染支持用户通过描述生成高质量的图片满足创意表达和设计需求。LaTeX与Markdown支持内置LaTeX和Markdown渲染功能帮助用户清晰表达复杂公式和想法。数据隐私与安全高度重视用户数据的隐私所有数据默认存储在本地确保用户完全掌控自己的信息。版本区别ChatBox提供了社区免费版开源版和收费专业版官方版两个主要选择满足不同用户的需求。社区免费版开源版完全开源免费用户可以自由下载和使用特别适合开发者和技术爱好者。支持多种AI大模型的接入但用户需自行配置API密钥。收费专业版官方版提供高级模型和标准模型的访问额度用户无需自己接入模型API适合开箱即用的使用场景。使用示例通过OpenRouter API接入DeepSeek-R1模型免费版的具体配置步骤如下注册OpenRouter账号并获取API密钥。打开ChatBox客户端或网页版进入“设置”页面。在“API配置”中填写信息并输入生成的API密钥。优势ChatBox在Mermaid流程图表渲染方面表现突出能够快速生成流程图、时序图、甘特图等多种图表形式满足用户的可视化需求。相比其他工具ChatBox在这方面的支持更加完善。ChatBox凭借其强大的AI对话功能、全平台支持和对用户隐私的高度重视成为AI助手领域的优秀工具。无论是社区免费版还是收费专业版ChatBox都能为用户提供卓越的AI使用体验。2.2 安装ChatBox并集成ollama官网Chatbox AI官网办公学习的AI好助手全平台AI客户端官方免费下载安装和上面Apifox一样安装完成后打开chatbox软件选择ollama服务器中大模型2.3 ChatBox界面介绍下面图标的gong按钮图标功能名称功能描述添加内容点击后弹出菜单提供三种选项•添加图片上传图片供AI识别或分析。•选择文件上传本地文档如PDF、TXT等让AI阅读或处理。•添加链接输入网页URL让AI抓取网页内容进行分析。MCP 服务器用于连接和管理MCP服务器。MCP通常指“模型上下文协议”允许AI访问外部工具或数据源。点击可添加您的第一个MCP服务器。知识库用于创建和管理个人知识库。您可以将常用文档、笔记或资料存入知识库让AI在对话中引用这些专属信息提供更精准的回答。联网搜索开启或关闭AI的联网功能。开启后AI可以实时访问互联网获取最新资讯、数据或事实增强回答的时效性。新话题用于开启一个全新的对话。点击后当前对话历史将被清空AI会以“空白状态”开始与您交流适合开启一个与之前无关的新主题。⚙️对话设置用于调整当前对话的参数。您可以设置模型温度、回复风格、最大回复长度等以优化AI的输出效果使其更符合您的需求。然后我们进入对话3. 个人总结最后总结一下首先感谢能看到这里的同学和大佬们。以上就是我从零开始折腾本地大模型的全过程了。作为一个大二学生刚开始接触这些东西的时候也是一头雾水。但真正动手去试了之后才发现其实门槛没有想象中那么高。当然过程中也踩了不少坑这里就不一一列举了跟着视频和老师讲的做与自己做完全不一样。千里之行始于足下。另外也想说本地部署确实有它的局限性。我的笔记本显卡也就那样跑个7B的模型已经有点吃力了想跑更大的模型或者同时跑多个任务风扇呼呼转。但我平时基本不太需要用本地模型。最后我也是一个小白很多地方理解得不一定准确。如果大家发现问题欢迎在评论区指出我会认真修正的也希望能和同样对 AI 感兴趣的同学多多交流 祝大家都能跑通自己的第一个本地大模型