
作者 | 唐小引出品 | CSDNIDCSDNnews6 月 5 日上午北京国家会议中心的会场里过道站满了人。这是 2026 腾讯云 AI 产业应用大会的主会场原本能容纳上千人的空间此刻显得局促。坐在我后排的一位嘉宾举着手机拍几张照片但很快放弃了——台上的人被密密麻麻的人头挡得严严实实。“我老婆让我拍姚顺雨但我压根看不到。”他自嘲地说道。而会场外还有很多人根本进不来。这场爆满的对谈主角是腾讯集团高级执行副总裁、云与智能产业事业群 CEO 汤道生和腾讯首席 AI 科学家、腾讯混元大语言模型及 AI Infra 负责人姚顺雨。对谈主题是《腾讯 AI 下半场》他们互相提问、互相回答。这是姚顺雨加入腾讯后的第二次公开亮相也是他首次线下真身出现在公众面前。自从这位 ReAct 架构的提出者、曾参与 OpenAI Operator 和 Deep Research 开发的明星 AI 科学家宣布加盟腾讯以来外界对他的好奇从未停止他为什么选择腾讯他在腾讯做了什么更重要的是他能否帮助腾讯在这场 AI 竞赛中扳回一城而汤道生在对谈最后抛出的那个问题更是直击外界最关心的话题“很多自媒体都会提到腾讯在 AI 上没有及时抓住一些机会。你觉得我们是走得慢了吗”为什么是腾讯一个 AI 科学家的三个理由对谈开场不久汤道生就直奔主题“你加入腾讯之前我记得我还问过你几个问题。为什么会选择来到腾讯而且你认为 AI 的下半场最重要的是什么”姚顺雨的回答从一个概念的澄清开始。“我想先解释一下什么叫做下半场因为我自己感觉这个词有点被滥用了。”他说“这个概念其实我去年在一个博客里面提出来的。”在姚顺雨看来AI 的“上半场”是一个寻找好方法的时代——你为下围棋做一个程序为翻译做一个模型每个任务都需要专门的解决方案。但过去两年随着大模型的出现情况发生了根本性变化“我们像有了一个锤子它可以去打任何钉子它是一个通用的方法来解决特别多样的问题。那么反而更困难的是怎么寻找好问题。”这个判断直接指向了他选择腾讯的第一个理由这里有很多好问题有很多好产品。“好的产品能够解决第一个问题就是我们做了这样的技术到底要把它用在什么地方产生价值。”姚顺雨说。但更重要的是第二点——环境和上下文context。“如果没有好环境Agent 没办法去协作。比如说如果你没有一个点外卖的 API那你即使想点外卖也没办法。”他认为在 AI 的下半场context 变得越来越重要“模型未来是把一个非常复杂的输入变成一个输出。那很多时候你有没有这个最原始的输入你知不知道这个人他到底在干什么你知不知道这个企业的各种各样的信息这一点的话我觉得腾讯有非常强的优势。”腾讯拥有微信、QQ、腾讯会议、腾讯文档等一系列高频产品这些产品每天产生海量的交互数据构成了丰富的上下文环境。对于一个想要让 AI 真正落地、真正产生价值的科学家来说这样的场景优势是其他地方难以比拟的。但姚顺雨强调第二个理由其实不是最重要的。最重要的理由是文化。“我还记得我第一次跟你聊天的时候包括和很多其他老板聊天的时候我第一印象是大家都非常的诚实。”姚顺雨看着汤道生说“大家做得好、做得不好都非常实在大家不会去掩盖。我知道我这里做好了我知道我这里没做好我知道这里应该怎么做。我觉得这个坦诚是我的第一印象。”他接着说“第二点就是腾讯总体是一个极其 trust-based、非常信任的机制。我觉得这一点对于做 AI 也是非常重要的。包括我觉得我们的文化有一个非常 low ego、非常 solid 的技术面。这些文化都是对于长期做一个 AI 组织非常重要的包括我们长期主义的坚持。”这段话说得很实在。在 AI 这个快速变化、充满不确定性的领域一个组织的文化底色往往比短期的资源投入更重要。坦诚意味着能够正视问题信任意味着能够给予科学家足够的空间长期主义意味着不会因为短期的波动而改变方向。姚顺雨给出了他对 AI 下半场的定义“我个人的目标我觉得就是要在中国建立一个长期的、极具 AI 价值的这样一个组织。”他认为今天的 AI 主要是三个部分首先是 foundation基础部分怎么把预训练和后训练这些技术做得非常 solid第二是产品怎么把这样的基础真正为用户产生价值第三是 frontier前沿探索怎么去探索新的研究范式探索新的机会。“我觉得最重要的是说我们要构建一个非常均衡的三角形这样的组织。”Co-design模型与产品如何真正结合如果说姚顺雨的回答解释了“为什么来”那么汤道生接下来的问题则直指“来了之后做什么”。“你刚才提到了模型跟产品产品可以提供环境里面有上下文。那我想问你一直我们一起开会常提的有一个词就叫 co-design。”汤道生说“怎么把产品跟模型能够比较紧密地结合起来”Co-design协同设计这是腾讯 AI 战略中的一个核心概念。在大模型时代模型不再是一个孤立的技术组件而是需要与产品、场景深度融合。但这种融合具体怎么做姚顺雨给出了三点思考。第一co-design 的前提是模型本身要做得很 solid。“首先预训练是一个相对产品无关product-agnostic的事情。它做得非常 solid可以提供一个非常强的 foundation。而且预训练最大的特点就是它是可扩展化地解决问题它的进步大概率在各种各样下游的任务都可以有一个提升。”这意味着模型能力的提升是一切的基础。没有一个强大的基座模型再好的产品设计也是空中楼阁。第二后训练要量体裁衣。“实用的价值是大于很多 benchmark 排名的价值。”姚顺雨说。这一点尤其重要——在 AI 领域很多公司热衷于在各种 benchmark 上刷榜但真正的用户价值往往与榜单排名并不完全一致。“我们跟各种各样的产品进行了深度的 co-design。我觉得 co-design 很关键的一点就是要产生闭环。我们做了大量的工作去把产品的输出做回流。”这里透露出一个重要信息腾讯正在建立从产品到模型的数据回流机制。用户在产品中的真实使用数据会反馈到模型的训练中形成一个持续优化的循环。第三LLM 时代和过去 AI 最大的区别是能力的复合性。“在 LLM 之前比如说你做一个翻译的产品你只要把翻译做好了就行了。你做一个围棋的程序你只要把围棋做好了就行了。”姚顺雨说“但今天即使你想做一个 Coding Agent你发现其实需要的能力是 open-ended 的。你需要非常好的上下文、大长度的处理能力你需要非常强的 reasoning 能力、planning 能力。它其实是一个非常复合的能力集。”这意味着单点的模型优化已经不够了需要全面的能力提升。而这种全面性恰恰需要多个产品场景的数据来支撑。姚顺雨举了元宝腾讯的 AI 助手产品的例子“我们跟元宝的 co-design因为模型有很强的多轮交互和推理能力这样的能力可以迁移到 AI 搜索或者其他产品。所以这些产品能够反哺模型的数据在这些数据上训练都可以提升其他能力形成一个网络效应。”这是一个很有意思的逻辑不是为每个产品训练一个专门的模型而是让一个通用的强大模型在多个产品场景中学习产品之间形成能力的相互增强。汤道生补充了一个细节“我们在讲元宝的时候还提到做了测试集的问题。产品里面大家使用的能力跟 benchmark 好像有蛮大的差异。”这句话点出了一个行业痛点很多模型在标准测试集上表现很好但在真实产品场景中却不尽如人意。腾讯的做法是基于真实产品场景构建自己的测试集用真实的用户需求来评估模型。从 ReAct 到 Agent一个博士论文的预言对谈进行到中段汤道生抛出了一个学术性的问题“你是 ReAct 架构的提出者博士研究也是围绕 Agent 智能体展开的。你几年前的一些观点到今天兑现了吗”姚顺雨的回答带着一种时空交错的感慨。“那段时间我还是挺感慨的因为我重新读了这篇博士论文我感觉回到了一个很远古的时代。”他说“我的博士论文的标题叫做‘Language Agents: From Next-Token Prediction to Digital Automation’那是2019年7年前。”2019年那是 GPT-2的时代。“它当时只能做 next token prediction而且它产生的一段话可能连续会有很多问题。所以我当时没有想象到它能够有一天成为改变世界的技术。”但即使在那个时候姚顺雨的想象力已经超越了当时的技术现实。“当时我的想象力可能比较荒谬吧。我觉得这个世界非常 complex世界不仅仅是个 open system它其实是个非常 dynamic system。我觉得它有一天的潜能不仅仅是做 text它其实在于把这个世界上所有的事情做 automation。当时我想的是 digital automation但现在看起来也有可能是 physical automation。”这个判断在今天看来几乎是预言性的。从 ChatGPT 到 Claude从 Operator 到各种 Agent 产品AI 正在从文本理解走向任务自动化。姚顺雨回忆起 ReAct 诞生的那个时刻“我还记得2022年7月的时候有一天晚上我跑了几次把 prompts 写好把当时的模型和一个手写的 Wikipedia API 连在一起然后它第一次可以检索网页和回答问题并且可以多轮交互。”“那种感觉就像威廉·吉布森说的那个感觉一样——我感觉这个未来已经来了只是还没有被 fully distributed。”他说“所以我当时就给导师发了第一份报告也就是真正把互联网连在一起而且能做到 long reasoning。我当时感觉未来5年或10年可能改变世界。但可能我没想到会这么快。”他的博士论文做了两部分工作第一部分是如何建立一个 Agent 方法论如何把一个 next token prediction 的机器变成一个 Agent变成一个自动化的机器最重要的工作可能就是 ReAct第二部分是怎么去定义 digital automation benchmark比如 WebShop第一个互联网购物任务和 SWE-bench第一个 Coding Agent 任务。“现在看起来Agent 最重要的两条可能确实是 Web Agent 和 Coding Agent。”姚顺雨说。更有意思的是他翻出了博士论文结尾写的 future work:“第一个是 train models for Agent第二个是 shift and robust deployment第三个是 scientific discovery第四个是怎么样去 help human。我觉得很感慨我说我现在其实在做我当年的 future work。很多时候觉得这个行业正在朝着这些方向走。那些当时挺小众的想法现在大家都在做。技术的发展往往超出我们的预期。”Coding Agent下一代模型的核心能力汤道生接着问“大家都说 Agent 需要消耗很多 token 去调用。这对于腾讯做下一代模型的研发你觉得什么是侧重有哪些地方比较挑战”姚顺雨的回答很明确“毫无疑问今天 Agent 或者 Coding Agent 有点像预训练一样是不得不做的事情是最基础能力。我个人觉得 Coding Agent 非常本质还有一个重要原因就是说它有点像图灵完备的事情当你有能力去控制自己的 file system当你有一个 container 的时候其实你是一个 complete 这样一个 system。”但他强调腾讯的打法会有几个区别第一即使大家都说 Coding Agent 最重要但还是要强调体系的全面化。“真的要把 coding 做好其实需要远不止 Coding Agent 这一点。你需要把推理做得非常好因为你需要各种各样的能力。大模型重要的一点是泛化性。”这是一个重要的洞察。很多公司在追逐 Coding Agent 的时候可能只关注代码生成能力但实际上要做好一个真正有用的 Coding Agent需要理解需求、规划架构、调试错误、优化性能等一系列能力这些都依赖于模型的综合能力。第二产品的 co-design 越来越重要。“如何好好利用线上的回流我觉得是每一个模型团队都在应对和思考的问题。这里我觉得我们的 co-design 经验逐渐发挥作用。”第三还需要很多探索能力。“无论是技术的演进还是产品的演进还是应用我觉得我们还是需要做一些探索性的、不确定的工作。”这三点加在一起勾勒出腾讯 AI 的一个整体图景不是单点突破而是系统性建设不是闭门造车而是产品驱动不是保守跟随而是保持探索。性价比的真相不只是模型架构对谈进入下半场话题转向了一个更实际的问题成本。“因为大家越来越多有 token 焦虑成本的压力是爆发式增长。”汤道生说“我也听到很多客户、甚至用户、同事们在盯紧计费的消耗。怎么可以让我们的模型在解决某个问题或者完成某个任务时token 效率最高”姚顺雨的回答打破了一个常见的误区。“其实我觉得在中国讨论性价比更多讨论的是模型架构。但其实它是一个很复杂的体系。”他说“我觉得最重要的首先是你的 performance。很多人跟我说他最后发现用 OPUS 这样的模型比用更差的模型更省钱因为更快地把这个事情做对了也省得人的精力。最重要的事情是 performance如果你的 performance 好性价比是最关键的事情。”这个观点很重要性价比的核心不是模型架构的创新而是性能本身。如果性能不好性价比无从谈起。“尤其我觉得今年可能很多简单任务的 robustness 会变得更加重要一次把相对简单任务做对这可能是性价比更关键的部分不仅是模型架构。”姚顺雨说。他进一步解释“第二部分就是成本它本身性价比第一是性能如果性能不好性价比无从谈起。第二点是成本中国是领先于世界的我们做大量工作优化我们的成本。成本可能最重要的事情是怎么用一个更小的模型把更高的价值任务做好在这基础上架构创新包括长文管理、脚手架有很多需要做的事情。如果我们做一个相对较小的模型但是它比肩大模型性能而且在大部分任务上做很强的 robustness这可能在很多长尾任务上面提升一两个点可能在今天的中国更有价值。”这段话透露出几个信息1. 腾讯在工程优化上投入很大这是中国公司的优势2. 但更重要的是模型本身的效率用更小的模型实现更好的效果3. 在中国市场长尾任务的 robustness稳定性比极端场景的突破更有商业价值。这是一个务实的判断。对于大多数企业客户来说他们需要的不是一个在某个 benchmark 上刷榜的模型而是一个在各种实际任务中都能稳定工作、成本可控的模型。Agent 的产品化场景、Context 和 Skills姚顺雨反过来问了汤道生一个问题“你觉得 Agent 什么时候会产生一个颠覆性的产品机会以及你现在认为什么是第一个好用的 Agent?”汤道生的回答很产品化“我们做的 Agent 针对不同场景其实有不同的产品形态。在 Agent 的设计上面其实大同小异都是要发挥好模型的能力。哪怕模型在迭代、它能力越强可能 Agent 需要做的工作也越来越少。”他分享了一个观察“我看我们好几个产品在过去这段时间确实是随着模型能力加强我们把产品做得更简化了更多的是给模型提供更多的 context创造更多的 skills让模型能够更高效地去完成任务。”这是一个重要的产品哲学转变在 AI 时代产品经理的工作不再是设计每一个功能细节而是为模型提供好的上下文和工具让模型自己去理解用户需求、调用工具、完成任务。“在不同赛道里面其实都可以针对每一个场景提供有用的信息、提供 context。”汤道生说“在 coding 的环境里面用相关的 context 给到模型在 Workbuddy 里面做协作、做 PPT可能大家关注的内容或者 context 也有些不一样。所以我觉得在做不同的 Agent更重要的还是了解那个场景下什么内容、什么信息是重要的、比较 relevant 的能够跟模型配合好让模型能够有它需要的信息同时发挥它的推理能力。”这段话看似平淡实际上揭示了腾讯做 AI 产品的一个核心逻辑不是让模型适应产品而是让产品为模型提供好的环境。模型是通用的但每个场景需要的 context 和 skills 是不同的产品的价值就在于把这些场景特有的信息和能力提供给模型。组织的演进小团队与大平台对谈接近尾声姚顺雨问了一个关于组织的问题“最近我们确实看到一些小团队在快速迭代产品。我挺好奇相对于我们在这种新的 AI 时代的研发组织管理上有什么变化”汤道生的回答很坦诚“前几年大厂里面有非常多的赛道、不同的组织在不同领域做探索。但我也发现最近几年大家可能在快速组建一些小团队在某些点去实验。我觉得这种敏捷的小团队是非常适合目前这个 AI 刚刚开始、很多应用可能都在找场景、在寻找 product-market fit 的阶段。”但他强调小团队也需要大平台的支撑“这些小团队也需要大厂的一些基础能力来做支撑。比如像我前面提到的 Furnace腾讯的 AI 基础设施体系像这些评测、测试这些比较前置的 AI 能力的保证。所以我们还要支持好这个 AI Infra 去做实验让不同的小团队可以去探索、去验证把质量保证的工作、alignment 这些做好。”这是一个很平衡的组织观既要有小团队的灵活性和创新性又要有大平台的基础设施和能力支撑。这也是大公司在 AI 时代的一个优势——可以让多个小团队在同一个强大的基础设施上并行探索降低试错成本提高成功概率。腾讯 AI 慢了吗一个直接的回应对谈的最后汤道生抛出了那个最尖锐的问题“很多自媒体都会提到腾讯在 AI 上面没有及时抓住一些机会。你觉得我们是走得慢了吗到底下半场是什么您能多说一下吗”姚顺雨的回答是整场对谈中最重要的部分。“我觉得首先 AI 其实今天有两个重要判断。”他说“第一个就是说我们认为 AI 是一个短期的游戏还是长期游戏在硅谷大家蔓延很多情绪哎呀2年后所有人都要失业AI 要取代所有人的工作我们要赶快赚2年钱退休。但很显然我们的判断 AI 是一个长期游戏其实我觉得 AI 刚开始下半场才刚刚开始我不认为 ChatGPT 和 Claude Code 会是唯一的 super App我觉得那是一个非常灰暗的世界我觉得肯定会有源源不断新的机会诞生。可能今天就像是70年代 PC 刚刚产生的时候我觉得还有很多很多事情需要做。”这是第一个判断AI 是长期游戏下半场才刚刚开始。这意味着短期的领先或落后并不决定最终的结果重要的是能否持续投入、持续进化。“第二个判断它会是个更线性还是多元游戏”姚顺雨继续说“因为确实过去几年大家能看到的是 Pre-training、post training然后 AgentCoding Agent似乎有一个非常清晰的主线这个主线是所有人都在做一样的事情都在 copy这也是非常灰暗的事情。但到底未来变得更单一还是更多元我个人看法会变得更多元毫无疑问 Coding Agent 生产力会变得更加重要我觉得它是刚刚开始的事情这个世界还有很多空间没有被填满多模态、具身智能很多很多新的事情都在发生或者刚刚发生所以从这个角度来说如果我们认为下半场刚刚开始可能确实不是完了。”这是第二个判断未来会变得更多元不是单一路径。不只是 Coding Agent 一条路还有多模态、具身智能等诸多方向。“过去模型、产品做了很多探索走很多弯路我觉得这是正常的你如果没有做过一个事情第一次做肯定有曲折。”他停顿了一下“但是我觉得可能更重要的事情是能不能诚实面对自己能不能 Be Real能不能够去看到 feedback 然后去改变能不能够保持耐心这个事情是下半场最重要的事情。”汤道生接过话题“对我觉得腾讯大家总是喜欢挑某一个点来批评当然我觉得我们也欢迎大家给我们提出更高的要求但我们还是有非常多业态很多产品在很多赛道同时也有很多的团队在推进不同的项目。”他的语气很平静“毫无疑问在这样一个庞大的组织里面有些地方可能我们做得快了有些地方做得慢了有些地方可能会做失败在探索。所以我觉得这些提醒都非常好我觉得确实有些地方是可以做得更好。”然后他说出了那句关键的话“就像你说的这是一场长跑腾讯还是有非常丰富的场景。所以我们在长跑中也请各位多给我们提醒多给我们建议也多用我们的产品来给我们最真实的反馈。”结语汤道生 X 姚顺雨对谈背后的战略清晰度这场对话的重要性、含金量十足我一直在想一个问题这场对谈到底想传达什么表面上看这是一场关于技术和产品的对话两位高管分享了腾讯在 AI 领域的思考和实践。但如果仔细品味会发现这场对谈其实是在回答外界对腾讯 AI 的三个核心质疑第一腾讯有没有顶尖的 AI 人才姚顺雨的出现本身就是答案。这位 ReAct 架构的提出者、前 OpenAI 研究员不仅加入了腾讯而且在对谈中展现出对技术、产品、组织的深刻理解。他不是一个被供起来的“吉祥物”而是一个真正在一线工作、推动模型迭代、参与产品设计的科学家。第二腾讯有没有清晰的 AI 战略整场对谈反复强调的几个关键词——co-design、context、长期主义——构成了腾讯 AI 战略的骨架。这不是一个追求短期刷榜、追逐热点的战略而是一个基于场景、注重实用、强调持续迭代的战略。这个战略可能不够性感但很务实。第三腾讯在 AI 上到底慢不慢两位高管的回答很一致AI 是马拉松不是短跑。这不是一个回避问题的托词而是一个战略定力的表达。在一个充满泡沫和焦虑的行业里保持耐心、持续投入、专注于为用户创造价值这本身就是一种竞争力。更重要的是这场对谈展现了一种难得的坦诚。汤道生没有回避外界的批评姚顺雨也没有夸大腾讯的成就。他们承认有些地方做得不够好承认走过弯路承认还在探索。这种坦诚恰恰是姚顺雨当初选择腾讯的理由之一。【END】