未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026

发布时间:2026/5/25 17:20:33

未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026 编辑部 整理自 AIGC2026量子位 | 公众号 QbitAI从硅谷投资人的视角望出去AI的叙事正在悄然换轨。在这个新旧周期交替的关键节点Fusion Fund创始合伙人张璐带来了她一线的判断过去两年行业所有的目光都聚焦在模型和算力上但真正的战场正在向基础设施的“通信层”和物理世界的“数据层”转移。在本次2026中国AIGC产业峰会上她将这一轮AI叙事的转向说得很直白——推理将超越训练成为算力消耗的新主角而数据中心里那个鲜少被提及的通信环节其耗电量可能是计算本身的百倍以上。至于下一个真正值得押注的方向在她看来并非更大的模型而是更真实、更高质量的数据以及医疗、太空、纳米机器人这三个AI应用方向。为了完整体现张璐的思考在不改变原意的基础上量子位对演讲内容进行了翻译和编辑整理希望能给你带来更多启发。2026中国AIGC产业峰会是由量子位主办的行业峰会近20位产业代表与会讨论。线下参会观众超千人线上直播观众近400万获得了主流媒体的广泛关注与报道。核心观点梳理算力需求的重心正在从训练转向推理训练是一次性的算力投入推理才是可持续的长期需求随着智能体交互替代对话交互推理算力的比重将从现在的50%继续攀升成为AI基础设施最核心的优化方向数据中心的真正电老虎是通信在AI数据中心内通信消耗的电量可能比计算本身高出百倍这意味着光学通信等新一代通信技术的价值远比通常认知的更为关键物理AI现在卡在数据层架构和算力都已具备真正的瓶颈是缺乏足够高质量的真实世界数据合成数据可以作为补充但无法替代边缘场景中的真实采集数据的质量比数量更重要而医疗恰恰是高质量数据密度最高的行业之一这是大量AI科技公司在2025年集中入局医疗赛道的底层逻辑而不只是因为它市场够大技术创新只是起点产业整合速度才是AI落地的真正竞争力当500强企业的AI预算从千万级跃升至数十亿级采购周期从半年压缩到一两个月这种加速度本身就是模型和应用持续迭代的燃料。以下为张璐演讲原文AI叙事的新拐点大家好我是张璐我是硅谷Fusion Fund的创始和管理合伙人。在过去的十到十一年的时间里我们一直专注北美市场早期科技公司的投资尤其专注在三个领域——企业级人工智能、医疗AI以及工业自动化。过去两年大家可能都关注到了硅谷经历了快速迭代的创新周期尤其是以人工智能为驱动的快速的产业创新以及产业植入的进程。所以我们在过去这两年非常辛苦但也非常兴奋看到了很多杰出的企业家、创业者快速地成长起来也看到了产业中从人工智能、基础设施再到人工智能的应用层面上多重创新的开展和发展。到今年我觉得已经进入到了一个新时期可以看到人工智能在整体的叙事上、创新的专注层面上有了一些新变化。所以今天也非常高兴有机会和大家分享过去一年我们看到的硅谷新兴的人工智能创新风向的变化以及一些最新的动态。过去几年我们在聊到人工智能创新的时候有几个关键词反复出现比如大语言模型、生成式AI、训练、算力需求等等。但最近这段时间我们看到在语境层面上也有一些新的转向比如不只是在讨论大语言模型现在更多在讨论行业专属应用基于的是小语言模型怎么样可以通过更加低成本、高效的方式去进行产业垂直人工智能的植入另外也是模型对象的转变。从语言模型现在更多讨论的是物理AI还有世界模型的调整。同时在计算层面我们也经常讲到人工智能的算力需求非常巨大以前算力的大量消耗可能是在训练端。但过去这段时间大家更多讨论的是推理对于算力的需求会越来越大甚至超过训练成为长期可持续的算力需求。在根本层面上我们也能看到有越来越多对于数据的讨论从最早我们经常讲规模定律Scaling Law认为有越多的数据意味着可以去训练出更好的人工智能模型。到现在大家更多关注数据的质量——怎么样可以拿到高质量的行业数据怎么可以通过高质量的行业数据去做更好的数据库我们称之为数据治理data curation还有数据图书馆data library。再基于这些数据的质量去优化人工智能无论是模型能力还是在应用能力上进行迭代。重新定义AI基础设施今天也想根据这些不同的方向跟大家快速分享几个我们非常看好、而且现在正快速发展的人工智能领域。首先要跟大家分享和聊到的就是人工智能基础设施。如果大家有关注英伟达3月的GTC大会也能看到英伟达的叙事在改变以前讲的是一家GPU芯片企业到现在黄仁勋已经非常明确——英伟达是一个人工智能基础设施公司一个人工智能工厂。从Token经济学来看未来对人工智能基础设施的需求可能就像对电力的需求一样常见这是一场非常巨大的基础层级的产业革命。所以我们看到对于人工智能基础设施的创新需求非常高。人工智能现在进入了产业部署阶段大规模的产业部署也需要非常强力的人工智能基础设施来辅助和支持。现在有大量新建的人工智能数据中心它们面临很多挑战比如电力的消耗、通信层面上的能量消耗还有各种各样技术问题。所以怎么样在这个层面上进行更多的技术创新也带来了很多的创新机会其中我们聊得比较多的就是基础设施本身的算力优化。我刚才提到核心的算力变化在于——以前算力关注更多的是训练本身但现在我们看到一个非常清晰的转变训练更多是一次性的算力投入但是推理是可持续的算力需求。几年前这两个层面上对算力的需求——训练的算力需求占到70%以上推理可能只有20%到30%现在推理已经占到了一半在未来可能会变成30:70训练:推理。尤其我们现在已经到了新的转变阶段即从聊天对话这种交互方式到现在智能体的交互。如果你有一个智能体你是不是希望这个智能体一直在线一直响应你这个过程中对于推理的需求就更加具有可持续性然后也更加大量这个过程中推理所消耗的算力也更为核心。因此怎样进行推理的优化怎样进行推理算力的优化是未来人工智能基础设施要去解决的核心问题之一。我们刚才主要专注的是说计算这部分的算力在人工智能基础设施层面上大家探讨的更多是在计算过程中消耗了多大的能量。现在全世界都在讨论人工智能的核心发展瓶颈之一就是耗电量但是在计算之后下一步是什么呢是通信Communication。这个通信的过程中有通信能力的需求有内部通信 还有交换机switch的需求在人工智能的数据中心里通信环节整体的耗电量可能比计算的耗电量要大几十倍甚至上百倍。我去年有幸在斯坦福和我们之前的老校长也是谷歌的母公司Alphabet的董事会主席John Hennessy做过一个对话在对话中他专门提到——在通信的过程中所消耗的电量可能比计算本身要超过百倍以上。CPU、GPU的设计思路其实是尽量在本地、在芯片本身做尽量多的计算而不是去进行更多的传输你可以把计算到处部署也可以把数据到处挪动但是挪动数据的过程中它消耗的电量比移动计算本身的成本更高。所以这也催生了很多新技术它们所关注的正是通信的部分——怎么样可以有新一代的通信技术我们经常提到现在有很多新创新是在光学通信层面上去大规模降低通信过程中的能量消耗这也是很关键的。我们刚才也提到一个转变就是从语言模型→世界模型→物理AI。到物理AI我们所应用到的数据不只是文本数据还有很多三维的数据、真实世界的数据而这些数据的量级也更加巨大。在这个过程中如果你再去到处传输数据它对于能量的消耗也会更加巨大。这也是为什么我们在这个领域会看到更多创新。物理AI的突围边缘计算与新型传感器刚才我提到了好多次“物理AI”。物理AI现在也是一个新兴发展的方向它不只是我们经常讲的人形机器人。物理AI 它其实涉及到了仿真模拟simulation还有数据层、世界模型等领域这些都覆盖到物理世界和AI的交互。无论是大家可能关注比较多的无人驾驶还是工厂领域高精度生产的整体物理AI的投放和使用还有医疗、物流供应链、太空行业等等都在大规模应用物理AI。怎么样可以让物理世界和AI更好地互动这也是现在创新很重要的方向。我们看到很多创新其实聚焦在一个是仿真模拟层另一个就是数据层。现在对于物理AI来讲最大的一个瓶颈是我们的架构做好了也有算力但现在最缺的就是数据现在最大的瓶颈也是在数据。我们没有足够高质量的真实世界数据去支持物理AI的模型训练当然这个过程中有很多人去聊一个相关方向就是合成数据。合成数据现在也是发展速度很快的一个方向包括通过合成数据再去看去支持仿真模拟 但在这个过程中会发现合成数据其实存在很多弊端或者盲点。所以对真实世界中边缘场景、边缘数据的收集还是非常关键的。这也就意味着我们不只是要去关注模型层的技术发展要更努力去投入新型的数据收集平台和数据优化平台的技术创新这样才可以有更好的数据库去支持物理AI进一步的发展。既然物理AI现在核心的一个痛点就是它的数据层。那怎么样可以获得真实世界和工业界的高质量数据这个时候你会发现比如传统的制造生产行业它其实产生了很多高质量的真实三维数据但是它的痛点在于没有一个非常好的数据收集平台去进行标准化的数据收集、数据优化和数据治理curation让数据整体达到可以进行人工智能模型训练的阶段。而在这个过程中因为很多真实世界的需求应用场景又对这样的数据收集平台的消耗有着天然的限制。所以怎样可以在边缘端更好进行人工智能的部署也是非常重要的一个方向。在这里我提到一个新的技术就是我们看到了很多年一直在发展的人工皮肤它核心是柔性电路叫Flexible Electronics。△来自斯坦福大学官网今年出现了很多这样的公司其中做得最好的研究之一是来自斯坦福大学鲍哲南教授的实验室他们所做的人工皮肤的传感器是一款高精度、低能耗的传感器它可以薄到就像手套一样无论是套在机械手上或者套在人的手上它的触觉有非常高精度的传感点这个触觉数据就可以成为非常重要的数据来源去支持物理世界。△援引自中国科学院学部在这个过程中我们不只看到初创企业在做新型的数据收集平台。我们在和一些500强企业尤其是一些500强的制造龙头企业对话的时候我发现他们自己内部也在做这方面技术的探索所以说大家其实意识到了核心的瓶颈是在数据层也有更多的创新聚焦到数据这一层。我还想再强调一点就是边缘计算。边缘计算未来的发展也会非常快这个方向对我们来说已经不是新方向了我们从2018、2019年就开始投资边缘计算。在过去两年我觉得产业形成了一个共识——人工智能发展的未来方向是在边缘端的人工智能部署。怎么样能够达到边缘端人工智能的部署又回到我们刚才涉及到的问题它需要的是一个小模型。比如说我们今年有一家公司刚被高通收购他们的模型就可以小到——不足10亿token 在这样的情况下你可以在一个Raspberry Pi树莓派上面去运行这个小模型它就可以有和GPT-4同等的人工智能能力。包括前段时间谷歌发布的一些开源模型也有一些非常小的边缘模型所以在边缘端的人工智能铺设非常重要。而边缘端AI的铺设再和新型的数据收集平台整合到一起我们就可以在边缘端进行数据收集、本地化处理和本地化的人工智能的应用所以对于高监管行业还有那些对数据隐私相对敏感的行业来说都是非常好的发展方向。关注三个应用方向医疗、太空与比细胞还小的机器人最后跟大家讲几个我非常看好的具体人工智能应用方向。今年对于硅谷来讲是人工智能医疗领域非常重要的一年在年初的时候先是礼来美国制药公司和英伟达成了一个10亿美金的合作。△来自英伟达官网他们的合作不只是人工智能和医疗的结合他们也希望构建一个人工智能医疗数据技术的生态去帮助更多的初创企业跟他们达成战略合作我们有好几家公司跟他们在进行合作。包括在1月份大家可能有关注到无论是ChatGPT还是Claude都发布了针对医疗领域应用的专属产品尤其是Claude做的Claude for Health其实是专注底层的基础设施在数据、隐私、安全还有合规层面上去帮助医疗领域的服务提供商和医院等等更好地进行AI医疗的整合。前一段时间大概几周前默克美国的制药企业世界上最大的制药企业之一也和谷歌Gemini发布了非常重磅的战略合作。所以我们会看到很多人工智能的科技企业都在纷纷入局医疗领域。医疗领域不只是美国市场最大的市场之一美国20%的GDP都在医疗领域更重要的一点是我们刚才提到的很重要的一个转变或者说共识——大家意识到数据的质量比数据的量更重要。哪个行业有海量的高质量数据其中一个很重要的行业就是医疗领域。2017年我们就开始发布AI医疗的报告去年又做了一个最新版可以看到很多新的进化。到现在我们会看到很多新型的AI医疗公司它专注的是一个垂直领域小模型。比如说专门针对细胞疗法做一个垂直AI模型针对MRA磁共振血管造影的测序数据专门做一个垂直模型甚至还有一些是针对特定疾病的比如说专门针对帕金森、老年痴呆去结合各种各样的数据、生物信息学进行个性化的诊断和治疗。这个过程中不只是AI模型还有包括机器人和物理AI也在医疗领域进行大规模的铺设。这里我提到一家公司叫Medra 也是我们去年刚投资的一家公司。他们是斯坦福背景的团队做了整一套的物理AI系统从AI层面上可以自己去理解怎么样进行生物医疗的实验设计同时进行机械手臂、还有自动化机器人实验到最后整体去自动化整个生命科学包括医疗领域的科研过程。几周前他们刚刚在旧金山开启了他们全球现在最大的一个全无人物理AI机器人的实验室现在正在昼夜不停进行各种各样的实验搭设。这家公司在早期的时候就和很多药厂合作所以现在我们去聊AI医疗已经不是几年前单纯的问诊、医生辅助功能现在已经涉及到了非常核心的个性化治疗部分。个性化治疗也不只是我们之前可能看得比较多的癌症、心脑血管疾病现在尤其是脑部疾病例如帕金森、老年痴呆、抑郁症这些都可以和AI、甚至物理AI进行深度整合。另外一个我个人非常看好的方向就是——物理AI和太空科技的结合尤其是未来3-5年整个太空领域的发展太空经济学、太空生态、太空基础设施的崛起都会非常快速。当然大家现在都在关注马上要到来的SpaceX的IPO这也是非常强大的信号会让大家看到接下来的三五年整个太空经济的快速崛起又因为太空生态的特殊性它就有天然的AI原生和机器人原生的特性。比如说我们会讲到太空基础设施的搭设在这个过程中就会用到很多物理AI 还有机器人的创新应用同时包括未来一个很大的发展方向就是太空工厂。当然你可以运送人上去太空工厂但是可能更好的选择是在短期内运送机器人上去。比如现在探月的任务你会发现在人类进行登月的尝试之前会部署很多的机器人和机械设备。我们自己也有投资专门做太空基础设施的公司尤其是机器人层面上的应用去进行这种效能提升。例如太空加油站所有设备都已经做好了而且在过去的这一年时间就已经达到了上亿美元的订单收入。所以这个产业的快速迭代发展也是一个非常新兴的、迭代非常迅速的人工智能创新方向。最后一个方向其实也跟医疗相关但它需要一定时间去成熟、但会让大家觉得非常兴奋的方向——就是以更小的维度去看机器人的发展我们叫它微米机器人或者纳米机器人。更小的机器人可以进到人类的血管里比如说去清除血栓或者更进一步缩小到DNA级别去进行靶向药物递送实现体内的免疫隐形。现在有越来越多的技术在这个方向进行迭代比如说进行血栓清除的微米机器人已经进入商业化应用的初始阶段。包括DNA引擎、Nanoswimmer纳米机器人领域的一个细分形态指会游泳的纳米级机器人还有靶向递药的这些纳米机器人的应用在未来几年也会有很好的前景和快速的发展。所以今天就和大家快速地分享一些在过去这一年多的时间里我们看到的一些让人很兴奋的AI发展方向。现在整个生态也处在迭代期还有很多新的模型架构在涌现。当然这个过程中整个AI生态也面临很多挑战但对于创业者来讲挑战就意味着机会所以我们会看到更多优秀的创业者跳到产业里去开展新方向的探索。作为投资人我们也非常幸福我觉得现在对早期的AI的投资人来说是很幸福的时刻可以看到这么多的技术不仅是处在创新的阶段还处在产业快速迭代的时代。最后想跟大家分享的就是除了技术创新之外现在更重要的一个时间节点就是从今年开始我们会看到产业对于技术整合的态度在快速变化。我们看到大量500强企业在人工智能方面的预算从几千万变到几亿甚至变到了几十亿。从以前销售周期可能需要半年甚至更长的时间到现在一个月、两个月的时间这种产业的快速整合才是人工智能技术能够快速发展的核心竞争力。因为只有到达真实的应用场景快速获得用户或者说得到应用场景的反馈获得高质量的产业数据才可以让我们的模型架构和应用不断迭代。所以也非常期待接下来这一年会有更多新的创新出现也欢迎大家有时间可以多来硅谷进行更多技术层面上的交流谢谢。一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—超千人线下参与、数百万观众在线观看的中国AIGC产业峰会实录来了近20位AI实战派如何看Agent、多模态、应用、算力...全部干货点击回顾 一键关注 点亮星标

相关新闻