【笔记】用cursor手搓cursor（三）简单尝试claude code-尧图网站设计

最近写着写着发现小模型怎么都不是很好用。感觉还是技术不到家。openclaw和nanoclaw等开源的也就那样了于是先把目光投向闭源的claude code。首先是下载问题要么你就好好做区域封锁整个官网 install.sh 会显示区域封锁着呢。然后回头在github上就能暴露下载地址 claude-code-issue-13888: https://storage.googleapis.com/claude-code-dist-86c565f3-f756-42ad-8dfa-d59b1c096819/claude-code-releases/stable这个就是stable的版本信息latest是最新版本信息有了之后继续根据这个 https://storage.googleapis.com/claude-code-dist-86c565f3-f756-42ad-8dfa-d59b1c096819/claude-code-releases 进行后续拼接/version/manifest.json就可以拿到不同系统和cpu arch的文件列表然后/version/os-arch/claude filename就能下载了。好了有了闭源的龙虾binary先玩起来exportOLLAMA_CONTEXT_LENGTH65536ollama serveexportANTHROPIC_BASE_URLhttp://localhost:11434exportANTHROPIC_AUTH_TOKENollama claude--modelqwen3.5:9b就可以本地跑了关了telemetry以后用tcpdump监测下还是蛮干净的。vim这个binary随便翻一翻有rust有bun有 ## 的prompt也就大概知道它是如何编译出来的了。网上关于claude code的逆向工程有很多文档了就不赘述大家自己看好了。剩下的就是拖到IDA里和文档一起学习了。claude code的memory和context管理写得相当娴熟比我的toy好得多但是在4GB VM里经常OOM。所以还是自己写能控制住内存占用。它确实能让35B模型的执行和推理能力提升不少但是对于9B模型还是比较难的。所以mac mini要是想自己养龙虾建议64GB内存运行35B当然如果你不怕慢网上诸如 flash-moe 这样的项目可以让48GB mac laptop pro 运行 qwen3.5 397B-A17B真正的cloud级别大模型加持。harness模式将核心完全托管给LLM这个模式显然不是我想要的最终形态。但是它能给出一些灵感激发。在进行下一步之前让我继续好好思考下belief系统并且继续探索下如果能让35B和claude code配合能把coding plan规划得更详细——从让claude模型直接写出所有代码变成让qwen 35B模型分解成各个小函数然后拼接出可运行的代码。

【笔记】用cursor手搓cursor（三）简单尝试claude code

相关新闻

Python基础_常用模块

DeepSeek-R1-Distill-Qwen-7B功能体验：Ollama部署后，实测推理速度提升3倍

Grep vs RAG vs ACE：AI编程助手如何选择？实测对比三大代码检索技术

基于Dify和LLM的新闻摘要生成系统实践

大模型压缩常用方法

queue函数的应用

Only Henan

掌握screen终端滚动技巧与缓冲区优化

Unity打包Android：内部构建与导出Gradle工程的深度对比与实战指南

揭秘ChatGPT+Mathematica协同教学：为什么92%的初学者在72小时内建立函数直觉？

AI短剧创作系统：从剧本生成到视频合成的全流程解析

remix-i18next TypeScript类型安全实践：确保翻译键与类型定义同步

揭秘ChatGPT+Mathematica协同教学：为什么92%的初学者在72小时内建立函数直觉？

AI短剧创作系统：从剧本生成到视频合成的全流程解析

remix-i18next TypeScript类型安全实践：确保翻译键与类型定义同步

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

国产DSP FT-M6678 DDR3配置避坑指南：从PLL时钟到PHY寄存器，手把手调通你的第一块板

Coze与Dify对比指南：低代码AI应用开发从入门到实战