
近日INSPIRE 2026 华为云创想者大会在上海举行。作为聚焦 AI 基础设施、行业落地与开发者生态的重要科技活动本届大会吸引了众多云计算、人工智能与产业应用领域的企业和开发者参与。Mind Lab Research Scientist、Algo 负责人刘启涵受邀在大会开放麦环节进行分享围绕“让 AI Agent 从真实经验中学习”这一主题介绍了 Mind Lab 在个性化 Agent 背后的强化学习基础设施探索。在分享中刘启涵首先介绍了 Mind Lab 旗下个人 AI Agent 产品 Macaron。与传统强调办公提效的 AI Agent 不同Macaron 的定位更接近日常生活中的个人 Agent它并不是简单帮助用户“把活干完”而是希望通过深度记忆、个性化理解和即时生成 mini-app 的能力帮助用户更好地管理生活、规划行动并持续成长。但真正的个性化并不止于一次问答或一套固定模板。对于个人 Agent 来说难点在于如何让模型持续吸收每个用户的真实反馈与使用经验并在成本可控的前提下形成差异化能力。为此Mind Lab 提出了 MinT一套面向真实任务、真实反馈和真实产品约束的强化学习基础设施。据介绍MinT 重点解决的是大模型后训练中的工程复杂度问题包括算力调度、分布式 rollout、训练编排、模型状态管理等环节。团队可以在该平台上定义训练模型、数据集、Loss、LoRA 方式和评估指标由 MinT 自动完成底层编排从而更快建立“使用—反馈—训练—评估”的学习闭环。在模型覆盖方面MinT 已支持 Qwen、DeepSeek、Kimi、GLM、MiniMax、VLA 等多个模型家族最高可支持 1T 参数规模。同时平台强调 LoRA RL 路线通过“一个 base 模型 每个用户一份 LoRA 差异”的方式让大规模个性化成为可能。从现场披露的案例看MinT 已在医疗编码 QC、个性化 Agent、智能客服、政务服务等场景中验证价值。例如在个性化 Agent 场景中用户已自建 34 万个 mini-app在智能客服场景中客户满意度提升 34%合规准确率从 89% 提升至 99.2%。随着 AI Agent 从“工具执行”走向“长期陪伴与持续学习”后训练基础设施正成为决定产品体验的关键底座。Mind Lab 此次在华为云创想者大会的分享也进一步释放出一个信号下一阶段的 AI Agent 竞争不只是谁的模型更强而是谁能让模型更稳定、更低成本地从真实世界中学习。