
上周三晚上老金我又一次打开Claude中转站后台看用量。那张账单条形图涨得比A股还猛。我盯着看了两分钟没生气就是有点疲。Claude Code跑一天几百万token下去钱倒还能接受关键是看那个输出——它每次都要把话讲完整、讲漂亮、讲到读者满意为止。我心里清楚里面起码有三成token是在重复解释、铺垫语气、礼貌客套。我点开GitHub Trending想找点新乐子结果第一条就是这玩意儿。一个emoji石头图标标题三个字「caveman」slogan写着「why use many token when few do trick」。直译过来差不多就是少词办大事何必字多。50天涨到63k stars3.7k个fork5月20日还在更新。看到这数据的时候我心里咯噔了一下。一个让Claude变穴居人的Skillcaveman是一个skill/插件。它的本事就一件——让模型的输出像穴居人讲话。技术准确性不掉但词全部砍到最短。它的README里直接给了Before/After对比老金我看完先笑了一下然后认真琢磨了十分钟。Normal Claude69 tokens“The reason your React component is re-rendering is likely because you’re creating a new object reference on each render cycle. When you pass an inline object as a prop, React’s shallow comparison sees it as a different object every time, which triggers a re-render. I’d recommend using useMemo to memoize the object.”翻译你的 React 组件之所以会重新渲染很可能是因为你在每一个渲染周期中都创建了一个新的对象引用。当你将一个内联对象作为 props 传递时React 的浅层比较机制会认为它在每一次渲染时都是一个不同的对象从而触发重新渲染。我建议你使用 useMemo 来对该对象进行记忆化处理。Caveman Claude19 tokens“New object ref each render. Inline object prop new ref re-render. Wrap in useMemo.”翻译每次渲染都会生成一个新的对象引用。若对象属性是内联定义的则会产生新的引用从而导致重新渲染。请将其包裹在 useMemo 中。同一个Bug定位同一个解决方案。69个token压到19个准确性100%保留。光看英文还体会不深。换个中文场景正常Claude会说「这个问题的根本原因可能在于你的认证中间件没有正确校验token的过期时间」caveman会直接给你「auth中间件token过期判断错。改成」。意思一点没丢。语气全部砍掉。4个模式文言文那个有点东西caveman不是一刀切。作者JuliusBrussee给了4个档位让你自己挑前三个我都试过确实能省token。但真正让老金我多看一眼的是最后那个wenyan模式。文言文。它的设计逻辑是这样——中文的现代汉语本身就比英文费token因为分词模型对中文不友好。但文言文不一样。文言文几个字能讲一件事「夫子曰」三个字顶白话十几个字对tokenizer来说文言文是天然省token的。老金我心里有一下是亮的。这个作者是真的下功夫了。我让Claude用wenyan模式回答了一个「Python里list和tuple的区别」。原本要写一段「list是可变的可以增删改查tuple是不可变的一旦创建就不能修改……」的Claude直接给我吐出来「list可变tuple不可。前者增删改皆可后者一经定终身不易」。讲道理这种风格用来回答技术问题居然意外地清爽。安装及使用Github地址https://github.com/JuliusBrussee/caveman安装就一行指令npx -y github:JuliusBrussee/caveman不要使用官方那个脚本win是有BUG的。使用方法 标记橙色的代表老金我常用的。不止省钱更像是反向训练AI老金我装上caveman跑了两天。token消耗确实降了。我做了个粗略统计同样的代码review任务开caveman前平均每次2400 tokens开了之后800左右。降幅大概65%到75%之间跟官方数字基本对得上。但真正让我停下来想的不是这个百分比。是这个项目背后的逻辑——它不是在优化prompt不是在压缩上下文不是在精调模型。它是从输出端反向定义了AI应该怎么说话。正常人做prompt工程路径是这样的写更精准的指令给更具体的范例限制更明确的格式。这一套是在「告诉AI怎么理解」。caveman反过来——它直接改了AI的「输出习惯」。你不需要每次都在prompt里写「请简洁回答」你只要装上这个skillAI就自动用穴居人语法说话。一次配置永久生效。这一下挺关键。老金我一直觉得AI真正的爆发点不是把活全权交给AI那听起来很爽但真用起来经常翻车。更重要的是人机协作——人负责目标、判断、取舍、审美AI负责搜索、生成、执行、提醒。最终要的不是一个AI自己觉得合理的结果而是一个符合人类目标的结果。caveman这种工具本质上就是用户在用一种meme的方式告诉AI别按你以为漂亮的方式说话按我能用的方式说话。是用户在主导沟通规则不是模型。49天涨63k starsmeme也是生产力这个项目的传播力老金我看了一眼数据挺服气的。49天涨到63k stars日均增长1300。这个增速放在GitHub历史上能挤进top级开源爆款。它能爆老金我琢磨了一下根本不只是因为它省token。省token的工具多了prompt压缩库一抓一大把。但只有caveman做到了meme传播 实用工具的双重buff。「穴居人说话」这个梗本身就是社交货币技术圈刷到了忍不住转普通用户刷到了好奇点进去试。它的README做得也很有意思每一行都在讲笑话但每一行又都在说技术。这种「认真做memememe就是生产力」的项目国内之前也有几个雏形但能做到这个量级的caveman算是给后来者立了个标杆。别急着冲先看几个坑caveman再香老金我也得把丑话说在前面。第一它只省output tokeninput不省。你给Claude发的代码、文档、上下文该多少token还是多少token。caveman管的是Claude嘴上的话不管你嘴上的话。如果你的输入本身就大省的那部分占比其实没你想的多。第二复杂推理场景可能损失。简单的Bug定位、概念解释、配置修改caveman完全hold住。但碰到那种需要详细推导过程的任务比如「请帮我分析这段代码可能的并发问题给出三种不同的修复思路」穴居人语法就显得太单薄了。这种时候你可能还是得切回正常模式。第三中文wenyan模式吃文化背景。你要看得懂「list可变tuple不可」这种半文半白的表达对老开发者无所谓对入门用户可能反而是阅读门槛。我建议团队协作场景里慎用自用爽就行。第四它依赖Claude Code的skill机制。其他IDE虽然官方说支持30但实际兼容度还是Claude Code最好。Cursor、Windsurf这些走的是配置文件适配体验上会有差异。写在最后老金我现在的工作流里caveman已经成了默认开关。每天写代码、做review、调Bug背景里默默给我省着token。我不需要每次都在prompt里写「请简洁」也不需要纠结模型回复是不是太啰嗦。它自己就把这件事处理掉了。更有意思的是这个项目让我重新想了一下AI工具的可能性。我们一直在想怎么把prompt写好怎么让AI更懂我们。但caveman提供了一个反方向——与其让AI更懂我们不如让AI按我们能用的方式说话。一个能省75% token的开源插件背后其实是用户对AI对话权的一次小小夺回。工具越多越考验人会不会取舍。真正省时间的从来不是装更多东西而是让AI少做那些没必要的客套。飞书****开源知识库实时更新交流群https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFfClaude Code Openclaw Codex 全中文从零开始的教程不懂代码照样造网站老金15万字Claude CodeOpenClaw教程免费开源我的小破站含我开源的项目https://www.aiking.dev/每次我都想提醒一下这不是凡尔赛是希望有想法的人勇敢冲。我不会代码我英语也不好但是我做出来了很多东西。我真心希望能影响更多的人来尝试新的技巧迎接新的时代。谢谢你读我的文章。如果觉得不错随手点个赞、在看、转发三连吧如果想第一时间收到推送也可以给我个星标⭐谢谢你看我的文章。