
写在前面此前用 Termux + llama.cpp 手工部署轻量大模型时,过程着实折腾——下载源码、编译 C++、配置路径,全靠一行行命令硬磕,最终虽能运行,却总觉得不够顺手。最遗憾的是,对话导出功能折腾了许久也没能搞定,整个体验缺了点“完整感”。这次换个思路,试试 Ollama 这个开箱即用的工具。目标很明确:不用编译、少折腾、界面更舒服,还要把对话导出稳稳搞定,让手机本地跑 AI 真正有“幸福感”。一、Ollama 是什么?简单说,Ollama 是把 llama.cpp 封装好的大模型运行工具。它底层用的还是 llama.cpp 推理引擎,但省去了所有复杂的手动配置步骤:不用编译源码,一行命令安装不用手动找模型路径,自动管理自带清爽交互界面,不用对着纯黑底白字硬看支持对话记录、模型多版本管理对不想折腾、想快速上手的手机用户来说,真的太友好了。二、关键澄清:装 Ollama ≠ 自带模型很多新手会混淆这一点,先讲清楚:1. Ollama 是“运行平台”相当于你装的视频播放器,本身不自带视频内容。它只是提供运行模型的环境,没有模型也没法用。2. Qwen2.5 是“模型文件”我们要跑的 AI 大脑,是独立的文件,必须单独下载。3. 下载命令ollama pull qwen2.5:0.5b三、Ollama 与手工 llama.cpp 对比对比项手工 llama.cppOllama安装部署需编译源码、配环境,步骤繁琐一行命令安装,无需编译,开箱即用启动方式命令长且难记,需手动传参数简单命令启动,参数自动适配界面体验纯黑底白字,无美化彩色清爽交互,阅读更舒服对话导出折腾许久未成功,体验差支持对话导出,一次搞定进程管理需手动管理进程后台服务自动运行,省心不卡一句话总结:llama.cpp 是让你懂底层原理的“折腾版”,Ollama 是让你真正用起来的“实用版”。四、安装踩坑与修复1. 初次安装遇网络问题pkginstallollama-y2. 换国内清华源解决