
Google在2025年5月下旬悄悄放出了两个开源项目Agent Substrate和AX。前者版本号v0.0.0后者v0.1.0全都挂在Apache-2.0协议下。这两个项目要干的事很具体——让成百上千个AI Agent共享同一份物理算力而不是一个Agent占着一台机器发呆。Agent Substrate跑在Kubernetes上面它把所有Agent会话的逻辑生命周期和底层的Pod、容器、Worker彻底拆开。一个Agent如果停下动作等待用户输入、等待外部工具返回结果Substrate立刻对它做快照挂起释放Worker。那个Worker扭头就去处理别的会话。AX则充当分布式运行时管理Agent的执行循环、事件日志、本地和远程Actor通信。最关键的是它原生支持在任意节点上恢复Agent几百毫秒就能续上不需要冷启动。Google放出的演示里给出了一个数字30个逻辑Agent会话同时跑但统计上任意时刻只有1个会话处于活跃执行态。结果就是这30个会话全部挤在同一份物理执行容量里硬件效率比传统每个Agent独占资源的做法高出97%。推理本身没变快但机器不用闲着。这一点直接戳中业界的软肋。企业一旦上量Agent在等待人类回复、爬数据、调API的时候GPU和内存全都在空转。传统方案要么掏钱让状态一直驻留内存要么忍受好几秒的冷启动把Agent拉起来。Substrate把这条路砍掉了。Google Kubernetes Engine的工程师Tim Hockin和产品经理Brandon Royal在项目发布时说得挺直白Agent基础设施正处在和Kubernetes早期一样的拐点上。他们没打算重新发明Kubernetes而是在K8s短板上盖了一层新的控制平面。这个控制平面专门应对突发、高频、间歇性的Agent工作负载设计目标就是承受百万次亚秒级工具调用。但这两个项目的文档也贴满了警告。Substrate的README明确写着“不保证任何向后兼容一切都可能变化”。AX的版本号才0.1.0API随时会大改。GKE团队自己都承认现在把它们扔进生产环境风险很高。极早期开源不算新鲜事但Google这次掏出的是一套把Agent生命周期彻底流式化的方案。Agent的逻辑会话成了可以随时冻结、随时迁移的东西不再跟任何一台机器绑定。这在架构上很像Kubernetes把Pod和服务解耦的做法只不过对象从微服务换成了Agent会话。Apache-2.0的宽松协议也让不少团队可以无负担地拿来拆解、修改、集成。只是现在任何踩坑的人都得做好跟着上游一起颠簸的准备。这套组合拳出来后最该紧张的不是大模型厂商而是还在用容器方案硬扛Agent并发的工程团队。当别人用一份算力跑你30倍的会话量成本结构就不是一个级别了。你现在管的Agent有多少时间是在空转