【笔记】用cursor手搓cursor(三)简单尝试claude code

发布时间:2026/5/22 3:24:09

【笔记】用cursor手搓cursor(三)简单尝试claude code 最近写着写着发现小模型怎么都不是很好用。感觉还是技术不到家。openclaw和nanoclaw等开源的也就那样了于是先把目光投向闭源的claude code。首先是下载问题要么你就好好做区域封锁整个官网 install.sh 会显示区域封锁着呢。然后回头在github上就能暴露下载地址 claude-code-issue-13888: https://storage.googleapis.com/claude-code-dist-86c565f3-f756-42ad-8dfa-d59b1c096819/claude-code-releases/stable这个就是stable的版本信息latest是最新版本信息有了之后继续根据这个 https://storage.googleapis.com/claude-code-dist-86c565f3-f756-42ad-8dfa-d59b1c096819/claude-code-releases 进行后续拼接/version/manifest.json就可以拿到不同系统和cpu arch的文件列表然后/version/os-arch/claude filename就能下载了。好了有了闭源的龙虾binary先玩起来exportOLLAMA_CONTEXT_LENGTH65536ollama serveexportANTHROPIC_BASE_URLhttp://localhost:11434exportANTHROPIC_AUTH_TOKENollama claude--modelqwen3.5:9b就可以本地跑了关了telemetry以后用tcpdump监测下还是蛮干净的。vim这个binary随便翻一翻有rust有bun有 ## 的prompt也就大概知道它是如何编译出来的了。网上关于claude code的逆向工程有很多文档了就不赘述大家自己看好了。剩下的就是拖到IDA里和文档一起学习了。claude code的memory和context管理写得相当娴熟比我的toy好得多但是在4GB VM里经常OOM。所以还是自己写能控制住内存占用。它确实能让35B模型的执行和推理能力提升不少但是对于9B模型还是比较难的。所以mac mini要是想自己养龙虾建议64GB内存运行35B当然如果你不怕慢网上诸如 flash-moe 这样的项目可以让48GB mac laptop pro 运行 qwen3.5 397B-A17B真正的cloud级别大模型加持。harness模式将核心完全托管给LLM这个模式显然不是我想要的最终形态。但是它能给出一些灵感激发。在进行下一步之前让我继续好好思考下belief系统并且继续探索下如果能让35B和claude code配合能把coding plan规划得更详细——从让claude模型直接写出所有代码变成让qwen 35B模型分解成各个小函数然后拼接出可运行的代码。

相关新闻