
AI 时代算力是核心引擎Token 是信息处理的最小单元两者都是智能化产线上的「硬通货」。然而近年来算力新基建持续提速Token 调用量爆发式增长真实业务场景中的价值产出却未能有效同步业界情绪开始从「算力不足恐惧症」转向「Token 焦虑」。天津智博会上海光信息总裁助理兼智能计算产品部总经理杜夏威指出「过去大家谈算力比的是单卡峰值现在谈 Token比的是单位产出。」在他身后海光展台上全系 CPU 和 DCU 产品一字排开从通用计算到 AI 加速从数据中心到边缘工控几乎覆盖了 Token 效益产出的每一个环节。Token 焦虑本质是算力到生产力的转化效率问题「Token 焦虑未必是坏事。如果大家对算力和大模型没有感知自然不会焦虑。焦虑说明产业在快速流动。」杜夏威对 Token 热的判断有些出人意料。他认为Token 的出现本身就是一个进步——它把算力和算法之间的度量衡统一了。「以前你说算力有多强用户听不懂。现在你说一个 Token 多少钱、响应多快所有人都能算账。」但这个统一的度量衡也暴露了问题算力指标和 Token 吞吐力之间存在一条不小的鸿沟。杜夏威打了个比方「芯片算力是物理天花板决定了上限Token 吞吐力是转化效率决定了用户实际能用到多少。」海光过去几年做的事可以理解为逐级搭建价值转化阶梯算力性能-适配效率-模型效率-Token 效率。每一步都有具体动作——400 多款主流大模型做到了 Day0 适配自研 DTK 软件栈让 CUDA 代码平滑迁移DCU 在多个模型推理场景下的首 Token 延迟做到低于 NVIDIA H20。杜夏威指出「训练看集群效率推理看单位成本」正在成为行业共识。在计算集群方面算力精度不足导致的应用能效下降甚至场景覆盖不足等问题颇为显见超智融合成为提升 Token 效益的重要途径。为此海光基于 DCU 全精度计算能力已支撑多个万卡级超智融合智算集群成功落地并且广泛覆盖了万亿参数模型训练、AI4S、AI4E 等前沿场景需求。除此之外海光 DCU 在推理场景的优化已经深入到算子层——Attention 算子融合、KV Cache 压缩管理、FP8/INT4 低精度支持目的是让客户「训得起也推得起」。CPU 被低估了它是 Token 经济的「中枢大脑」智博会现场另一个被反复讨论的话题是 CPU 在 AI 时代的新角色。「过去在 AI 训练阶段Token 或者说 CPU 的性能并没有充分体现。」海光信息总裁助理、创新产品线总经理李成指出随着 OpenClaw 等智能体Agent爆发CPU 的重要性正在回归。因为 Agent 不是简单问答而是「长在线、高交互」——持续运行、调用工具、访问记忆、执行任务。有研究显示在智能体工作负载中CPU 端的处理延迟占比最高可达 90% 以上。GPU 负责「算得快」CPU 负责「跑得久、调度稳」。如果 CPU 扛不住GPU 再强也只能空转。这是 Token 价值产出的又一个关键环节。「大模型参数量越来越大MoE混合专家成为主流结构我们不得不将 KV Cache 和部分算力 offload 到 CPU 端。」杜夏威补充道「这导致即便在数据中心内部CPU 和 GPU 的耦合也越来越紧CPU 的作用只会越来越大」。海光 C86 系列 CPU 恰好卡位在这个趋势上。其原生兼容 x86 生态端侧和边缘场景表现出色同时从指令集层面内置了国密算法和可信计算能力对熔断、幽灵等漏洞原生免疫。用杜夏威的话说「算力底座稳了上层 Token 产出才稳得住、跑得快。」端侧算力崛起AI 落地的「最后一公里」AI 的下一步不能只靠数据中心。尤其在现实生产场景中Token 不会永远飘在云端工厂产线、变配电站、交通路口数据实时处理必须在现场完成端侧算力成为快速响应的关键。光合组织嵌入式产品专家张考华在采访中指出「AI 这场大戏数据中心训练只是开场。未来能发展多深、影响多广要看边端。」他判断边端算力需求必将迎来爆发式增长。端侧场景已经铺开。从智能制造、能源电力到机器人边缘侧对高可靠、低延迟 AI 算力的需求正在激增。张考华特别提到一个趋势「算力上天」——星际探索中很多算力不需要传回地面「边缘侧算力和 Token 引流的意义远超大多数人想象」。海光与光合组织的打法是「云边协同」通过云上算力网络服务中小企业和个人开发者同时提供私有化算力方案让对数据安全敏感的行业用户可以在本地完成 AI 转型。「云端提供便捷 Token 服务私域沉淀数据资产、做深度业务整合。」张考华说两种模式互为补充共同覆盖了从消费端到产业端的全场景算力需求。在双芯产品阵列中海光这次专门展出了工控和嵌入式芯片解决方案。据介绍这款芯片继承了 C86 架构的技术积累宽温支持、工业可靠性、内生安全等方面均做了针对性设计在很多边端实测场景中打破了国产工控芯片「能用但不好用」的印象。从数据中心到边缘节点国产芯片展现的能力版图已经清晰不止是在单一维度上比拼参数而是用一套覆盖「端、边、云」的算力协同体系系统性解决 Token 从生产到变现的堵点。我是木易Top2 美国 Top10 CS 硕现在是 AI 产品经理。关注「AI信息Gap」让 AI 成为你的外挂。