手把手搭一个不会忘的知识库

发布时间:2026/5/29 5:04:03

手把手搭一个不会忘的知识库 这篇是教程。上一篇聊了 Karpathy 的 LLM Wiki[1] 思路。这篇把它落地。不需要写代码。不需要部署服务器。一台电脑一个 AI Agent一个下午就能搭起来。先说清楚我们要搭的是什么。核心就一件事。AI 回答完之后有价值的东西写回知识库。下次再问它已经知道了。不再每次从零开始。好。开始搭。第一步建目录结构在你电脑上找个地方建一个文件夹。我用的是 Obsidian你用任何支持 Markdown 的工具都行。目录长这样。my-wiki/├── raw/ ← 原始资料只读不改├── wiki/ ← 知识层AI 维护的地方│ ├── index.md ← 内容地图│ └── log.md ← 操作日志└── AGENTS.md ← 规则文件告诉 AI 怎么干活三个部分。三个职责。raw/ 是仓库。只往里放东西不改里面的内容。wiki/ 是车间。AI 在这里加工、整理、更新。AGENTS.md 是规矩。没有它AI 每次整理的方式都不一样。有了它wiki 才不会越来越乱。想了想。这就像开一家店。raw/ 是进货的仓库。wiki/ 是货架。AGENTS.md 是店员手册。没有手册每个店员摆货的方式都不一样。有了手册谁来都能接手。第二步写 AGENTS.md这是最关键的一步。很多人跳过了后面就乱了。AGENTS.md 不需要写很长。但几件事必须说清楚。我自己用的模板长这样。你可以直接复制然后根据自己的情况改。# Wiki 维护规则## 目录结构- raw/ 存放原始资料只读不改- wiki/ 存放整理后的知识页面- wiki/index.md 是内容地图每次更新 wiki 后必须同步更新- wiki/log.md 是操作日志每次操作后追加一条记录## 页面类型- 摘要页一篇资料对应一页摘要文件名用 summary-原文标题.md- 概念页一个概念一页文件名用 concept-概念名.md- 对比页多个东西的对比文件名用 compare-主题.md## 格式要求- 每页开头写一句话摘要- 必须标注来源格式[来源raw/文件名]- 页面之间用 [[双链]] 互相引用## 回写规则- 每次回答用户问题后如果产生了新的结论或发现写一页新的 wiki 页面- 更新 index.md- 在 log.md 追加一条记录## 人工复核- AI 不确定的内容在页面顶部标注 [待复核]- 涉及数据、结论、判断的页面标注 [需人工验证]这就是 Karpathy 说的 Schema 层。看着简单。但没有它wiki 三天就乱了。第三步准备你的第一批资料不要贪多。找一个你最近反复在看的主题。挑3到5份资料。放进 raw/ 目录。可以是文章的 Markdown 文件。可以是论文的 PDF。可以是你自己的笔记。可以是网页的截图。我第一次试的时候放了3篇关于 AI Agent 的文章。够了。先跑通流程再扩大规模。第四步让 AI 做第一次 ingest打开你的 AI Agent。Claude Code、Cursor、Kiro都行。把整个 my-wiki/ 目录给它。然后说。请阅读 AGENTS.md 了解规则。然后阅读 raw/ 目录下的所有资料。按照规则为每份资料生成 wiki 页面。更新 index.md 和 log.md。然后等它干完。第一次 ingest 的完整流程是这样的。干完之后打开 wiki/ 目录看看。你应该能看到几个新文件。每个文件对应一份原始资料的摘要。index.md 里列出了所有页面。log.md 里记录了这次操作。如果 AI 没有按规则来检查一下 AGENTS.md 写得够不够清楚。大多数时候问题出在规则不够具体。第五步问一个跨资料的问题这一步很关键。不要只问「帮我总结第一篇文章」。那和普通的 AI 对话没区别。要问一个需要综合多份资料才能回答的问题。比如我放了3篇 AI Agent 的文章。我问的是。根据 wiki 里的内容目前 AI Agent 的主要架构模式有哪几种各自的优缺点是什么AI 会去 wiki/ 里找相关页面综合出一个回答。这个回答本身就是新的知识。第六步把回答写回 wiki这是整个流程里最容易被忘掉的一步。也是最重要的一步。告诉 AI。刚才的回答很有价值。请按照 AGENTS.md 的回写规则把这个结论写成一页新的 wiki 页面。更新 index.md 和 log.md。这就是 Karpathy 说的 file back。回答不再消失在聊天记录里。它变成了 wiki 的一部分。下次你再问相关的问题AI 已经知道这个结论了。不用重新推导。这就是「用完不忘」。第七步检查一遍AI 写的东西不一定全对。打开 wiki/ 目录。逐页看一遍。检查几件事。来源标注对不对。有没有写了结论但没标来源的。有没有页面之间的链接是断的。有没有明显的错误或过时的信息。Karpathy 在 gist[2] 里说过一句话。Human owns verification。AI 可以维护 wiki。但最终验证的责任在你。这一步不能省。日常使用循环起来搭完之后日常使用就是不断重复这个循环。每转一圈wiki 就厚一点。AI 知道的就多一点。回答就准一点。这是一个正循环。用得越多越好用。两个核心文件怎么写index.md 和 log.md 是 wiki 的骨架。给你看看我的长什么样。index.md 示例。# Wiki 索引## AI Agent- [[summary-agent-survey]] AI Agent 综述论文摘要- [[summary-react-pattern]] ReAct 模式详解- [[concept-tool-use]] 概念工具调用- [[compare-agent架构模式]] 对比三种主流 Agent 架构## 知识管理- [[summary-llm-wiki]] Karpathy LLM Wiki 思路摘要- [[concept-file-back]] 概念回写机制最后更新2026-04-08log.md 示例。# 操作日志## 2026-04-08- [ingest] 导入 raw/agent-survey.pdf生成 summary-agent-survey.md- [ingest] 导入 raw/react-paper.md生成 summary-react-pattern.md- [query] 用户提问「Agent 架构模式对比」生成 compare-agent架构模式.md- [file-back] 将对比结论写回 wiki- [lint] 检查完毕无断链一个管空间。一个管时间。Karpathy 说在大约100篇资料、40万词的规模下靠这两个文件就能导航整个知识库。不一定需要复杂的 RAG 基础设施。但前提是你的 wiki 是有结构的。不是一堆散乱的文件。进阶让 wiki 为你的 Agent 工作搭到这一步wiki 已经能帮你记住东西了。但还可以更进一步。Farzapedia[3] 的作者 Farza 说了一句话。这个 wiki 不是为我建的。而是为我的 Agent 建的。什么意思。他把自己的日记、笔记、聊天记录都喂进了 wiki。生成了400篇互相链接的个人百科。当他让 Agent 帮他做一个新产品的 landing page 时Agent 会自动去 wiki 里找他历史上喜欢的设计风格、竞品分析、审美偏好。做出来的东西不再是通用的。而是「他的」。想了想。这个思路挺妙的。你往 wiki 里沉淀的不只是知识。还有你的判断、你的偏好、你的经验。AI 读了之后它的输出就带上了你的印记。wiki 不只是记忆。是你的 Agent 的工作底稿。容易踩的坑搭的过程中我踩了几个坑。提前说一下。第一个坑。AGENTS.md 写得太模糊。比如只写了「生成摘要」没说摘要多长、什么格式、要不要标来源。AI 每次生成的东西都不一样。后来我把格式要求写得很具体问题就解决了。第二个坑。不做 file back。问完就走了。回答消失在聊天记录里。下次又得重新问。这是最常见的问题。解决办法是在 AGENTS.md 里写死回写规则。每次回答后必须检查有没有值得写回的内容。第三个坑。从不检查。AI 写的东西不一定对。尤其是跨资料综合的结论可能有张冠李戴的情况。社区评论区[4]里有人建议每种实体类型一个模板给索引设 token 预算。这些都是实战中总结出来的。第四个坑。一上来就喂太多资料。先用3到5份资料跑通整个流程。确认 AGENTS.md 的规则好使了再慢慢扩大。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻