
小米 MiMo Code 开源发布6 月 11 日凌晨小米 MiMo 团队发布终端编程 Agent 产品 MiMo Code并采用 MIT 协议开源。其开源地址为 https://github.com/XiaomiMiMo/MiMo - Code。该产品基于 OpenCode 构建定位于面向长程自动化编程任务的终端编程 Agent核心目标是解决 AI 编程 Agent 在几十步甚至上百步持续执行中的决策质量、状态连续性和跨任务经验积累问题。MiMo Auto 目前限时免费基于 MiMo - V2.5支持 100 万 token 上下文。罗福莉在 x 上称“14 天、5 个人、一场 vibe coding 之旅。于是MiMo Code 诞生了。”她还透露有盲盒惊喜Auto 模式下的新用户可能会被随机分配到 UltraSpeed 模式——MiMo - V2.5 - Pro 将以 1000 tokens/s 的速度飞快输出。与 Claude Code 对比作为 AI 编程工具的翘楚Claude Code 是重要参照物。小米披露MiMo Code MiMo - V2.5 - Pro 在三项离线 benchmark 中均优于 Claude Code Claude Sonnet 4.6。不过团队指出这些 benchmark 主要衡量单个仓库级问题的一次性解决能力而 MiMo Code 的多轮记忆、后台状态维护、完成度验证和跨 session 进化等设计主要价值仍需在持续几十轮的真实开发场景中体现。小米表示在同一目标模型下对比 MiMo Code 与 Claude Code 的端到端真实开发体验时MiMo Code 的优势会随任务复杂度增加而放大。当执行步数在 200 步以内时两者胜率接近 50%当步数超过 200 步并包含多轮用户交互后MiMo Code 胜率升至 65%以上。有体验过的用户表示 MiMo Code 使用顺手UI 体验不错响应速度似乎快于 Claude Code且可能向会话中注入更少冗余内容。也有用户获得 MiMo - V2.5 - Pro UltraSpeed 模型访问认为其速度快但成本高于 DeepSeek仍需评估是否值得长期使用。开发者关注与问题反馈MiMo Code 引发了开发者们的关注截至目前该项目已获得 5.1k star。有用户看到是基于 OpenCode 构建后认为它只是 OpenCode 的一个分支但也有人觉得如果之前用 OpenCode 开发那 MiMo Code 就是 OpenCode 的加强版。有开发者担忧开源生态里的 PR 太多问题“OpenCode 可能是目前开源 Agent 中最成熟的那一个只是官方太忙协调不过来 5000 多个 PR 没人审核不知道小米那边会怎么搞迅速涌入大量的 PR 来不及审核可能是 AI 时代的必然结果。”小米 MiMo Code 开源后开发者的反馈迅速集中到 GitHub Issues 区目前已有超 200 条 Issues。从当前公开 Issues 看MiMo Code 暴露出一批早期产品问题如使用非常卡、MiMo Auto 免费通道登录后凭证未持久化、从 Claude Code 导入 API Key 失败、升级后仍显示 OpenCode 字样、Termux 环境日志暴涨、WSL 安装后运行异常、语音与粘贴功能不可用以及 Agent 未经确认自动删除用户全局 npm 包等。有用户反馈MiMo Code 的 Agent 在执行任务时自动检测到用户全局 npm 目录下存在 OpenCode 相关包并自行判断这些包是迁移残留随后未经用户确认执行 npm uninstall导致用户正在使用的 OpenCode 开发环境被破坏。该用户认为Agent 不应在未经明确确认的情况下执行任何删除操作尤其是影响范围较大的全局 npm 包操作建议对于 npm uninstall、rm 等删除操作必须增加确认机制并考虑提供 dry - run 模式先展示将执行的操作再由用户确认。还有用户反馈疑似存在内存泄露以及 MiMo Code 思考陷入重复螺旋等问题。其他平台上也有用户指出MiMo Code 默认开启 telemetry会向 tracking.miui.com 发送指标信息虽可通过环境变量 MIMOCODE_ENABLE_ANALYSIS false 关闭但“默认开启且命名为 analysis”的设计并不理想。也有用户指出即使关闭遥测工具仍会自动检查更新并获取 MiMo 模型列表不过这些行为也可禁用。开源引发的讨论Claude Code、Codex 等工具成为开发者日常工作流的一部分但这些工具是否锁平台以及是否会在上下文、工具调用和遥测层面形成新的“黑箱”等成为开发者关注的问题。有开发者评价 MiMo Code 的开源“很好coding harness 就应该开源而大模型应该被视为商品化能力。这样可以最大限度降低用户的切换成本也能让人们更清楚地理解自己是如何与上下文以及大模型输出进行交互的。现在整个行业的方向走偏了Claude Code 一直保持闭源尽管它已经多次泄露过源代码而开源的 Gemini CLI 也被逐步弃用转而让位于闭源的 Antigravity CLI。”对于开发者的观点也有网友质疑企业为什么要主动开源这些工具、降低用户迁移成本“这类似于要求云服务商把平台全部开源、取消出口费用让客户随时离开。”在其看来开源并不天然等于商业模式企业没有义务把有价值的产品层变成公共品。MiMo Code 的开源引发了对“coding harness 是否有护城河”的激烈讨论。一派认为真正完成代码任务的是底层模型coding harness 本身并没有太多神秘之处更多只是用户体验层能力另一派则指出不同 harness 的配置、工具设计、人类审批机制、diff 展示、上下文注入方式都会显著影响最终效果。有人分析表示Anthropic 通过 Claude Code 把大量订阅额度与编程使用场景绑定不只是赚取 token 收入更是在获得高价值软件开发数据并推动开发者围绕其 harness 概念形成使用习惯。Anthropic 原本通过 API token 获得中等规模的收入但当他们开始把大量使用额度打包进 Claude Max 的 20/100/200 美元订阅套餐后一切都变了。相对于 API token 的价格这些订阅套餐给出的使用额度非常夸张但前提是必须使用他们的 coding harness。而至少在 Claude Code 刚开始这么做的时候它作为一个 coding harness其实还不如很多开源工具。严格来说Claude Code 是一个免费产品因为可以用它接入任何模型。它对“一个 coding harness 应该如何工作”并没有太多流行的、强主张式设计但它却是目前最受欢迎的同类产品甚至在 OpenAI、Meta、Google 这些竞争对手的大模型工厂里也被广泛使用。Anthropic 能赢下自家 harness、自家 token 的使用量同时还能获得可观收入是因为他们大幅补贴了 token 消耗。这给他们带来了关于软件开发如何使用大模型的一手高价值数据、把整个行业引导到围绕他们的 harness 概念形成事实标准以及所有这些数据。因此MiMo Code 的开源也被部分用户视为对 Claude Code 等闭源工具的一次挑战。与 Claude Code 工程重点分化从技术路线看Claude Code 和 MiMo Code 都属于“模型 运行时 工具调用循环”的终端编程 Agent。模型负责推理和决策运行时负责管理工具、组装上下文、执行命令、持久化状态并把工具结果反馈给模型进入下一轮。但二者的工程侧重点出现明显分化。通过对 Claude Code 的全面源码级架构分析VILA 实验室得出结论Claude Code 代码库中只有 1.6% 属于 AI 决策逻辑其余 98.4% 都是确定性的基础设施包括权限管理、上下文管理、工具路由和恢复逻辑。Agent 循环本身只是一个简单的 while 循环真正的工程复杂度存在于围绕它构建的外围系统之中。Claude Code 的每一项设计选择都可以追溯到人的决策权、安全性、可靠性、能力放大和适应性。系统有 7 层安全机制但它们都受到性能约束影响。此外跨层交织的 Harness 难以重新实现其中循环很容易复制但 hooks、分类器、压缩机制和隔离机制并不容易复制。相比之下根据小米的博文MiMo Code 更聚焦长程编程任务围绕“计算、记忆、进化”三条主线强化决策质量、多轮状态连续性和跨 session 的经验沉淀。小米 MiMo 团队认为在短任务中完整对话历史通常可以作为工作记忆。但当任务进入几十轮甚至上百轮后上下文窗口、指令遵循率和任务状态管理都会成为瓶颈。为此MiMo Code 将长程编程 Agent 的瓶颈拆分为三个时间尺度同一 session 内的单轮决策质量主要受限于计算量、同一 session 内的多轮任务连续性主要受限于状态管理以及跨 session 的任务改进主要受限于经验提炼机制。对应到产品设计上就是“计算、记忆、进化”三条主线。在计算层面MiMo Code 引入 Max Mode 和 Goal。Max Mode 是并行采样选优目标是降低长任务中单步错误率被累积放大的风险。小米 MiMo 团队称在 SWE - Bench Pro 上Max Mode 相比单次采样提升 10% 至 20%代价是约 4 - 5 倍 token 消耗目前该功能仍处于实验阶段需要手动配置开启。Goal 机制主要解决“做完”问题允许用户用自然语言设定停止条件与 Claude Code 的停止机制不同MiMo Code 显式引入独立 verifier把“做事的 Agent”和“验收的 Agent”分开。MiMo Code 还尝试优化工具调用语法认为模型通过何种格式发出工具调用会直接影响准确率和 token 效率。在任务编排上Claude Code 的编排方式更偏模型逐步决策而 MiMo Code 则提出 Dynamic Workflow把复杂流程编排从 prompt 迁移到代码。小米认为当任务规模扩大到整个项目迁移等场景传统方式会系统性失效Dynamic Workflow 可让模型的判断力集中用于理解代码和生成代码而不是承担流程控制本身。MiMo Code 的实现兼容 Anthropic Dynamic Workflow 的核心语义并扩展了 workflow() 原语、日志恢复和沙箱内文件读写等能力。Claude Code 的记忆体系主要包括 CLAUDE.md、auto memory、JSONL session transcript 和子 Agent sidechain transcript本质上仍是在有限上下文窗口内做“压缩与管理”。MiMo Code 的目标是让一个逻辑会话可以无限延伸而每个上下文窗口仍保持有界其基本机制是 Cycle。小米强调checkpoint 应在相对早期触发MiMo Code 没有让主 Agent 自己维护记忆而是将记忆提取交给独立 writer subagent。在长期记忆体系上MiMo Code 设计了四层记忆。在进化层面MiMo Code 试图让 Agent 从跨 session 的经验中持续改进。其项目级记忆文件采用 Markdown 格式为维护项目记忆质量还设计了 Dream 与 Distill 两类整理机制。那么MiMo Code 能否在未来的编程领域取得更大的突破与 Claude Code 等工具的竞争又将走向何方呢