
在企业技术领域一年的时间或许听起来并不长但在人工智能领域过去12个月已经彻底改写了企业架构的游戏规则。在拉斯维加斯举办的戴尔技术世界大会期间戴尔全球首席技术官约翰·罗斯John Roese在接受《计算机周刊》采访时指出智能体AI的成熟正迫使IT领导者重新审视基础设施、数据管理和运营成本。我们对AI使用方式的基本假设已经发生了根本性转变它不再是像聊天机器人那样的一次性任务罗斯说现在是将目标交给AI系统去完成这正是当今智能体所做的事情。他以谷歌对搜索引擎的重新设计为例说明你给它一个目标它去执行各种搜索操作然后为你构建出一整个页面。这些都是智能体在协同完成一个目标。由于智能体AI带来了更优越的用户体验——人类从执行者转变为指令发出者——企业正在淘汰旧有的生成式AI应用场景将其重构为基于智能体的工作流程。破除GPU训练的迷思尽管早期AI热潮推动了企业争相抢购用于模型训练的图形处理器GPU但罗斯表示企业的基础设施需求与超大规模云服务商有着根本区别。外界流传着一种说法认为企业需要数千块GPU罗斯解释道但戴尔内部规模最大的工作负载只使用了16块GPU却能支撑4万名员工的使用。企业根本不需要数千块GPU因为针对每个工作负载、每个智能体或每个项目你只需要少量的GPU有时候半块GPU就够了。这是因为企业AI部署的重心完全在于推理而非训练。对智能体而言你只需要推理能力智能体不涉及任何训练。不过推理工作负载所需的架构也正在发生变化。当企业部署聊天机器人时架构对CPU的负载很轻。但AI智能体需要调用外部工具、通信协议和知识图谱这些组件并不天然存在于GPU之中。切换到智能体模式后算力结构趋于均衡罗斯说CPU和GPU的数量比例非常接近大约每两块GPU对应一个CPU。你不能只堆叠GPU来构建AI基础设施而要将GPU与传统CPU算力结合起来。前沿模型的气隔部署与边缘端落地企业也从强大AI模型部署方式的变化中获益。一年前最顶尖的前沿模型只能通过云端API调用。而随着超大规模云服务商通过谷歌分布式云等服务支持顶级模型本地运行罗斯指出私有模型现在可以在多种拓扑结构下部署。你可以在虚拟私有云或自有数据中心中使用它也可以将其与其他系统完全隔离。而在一年前除了API调用这一种选择之外这些选项都不存在。与此同时AI正以一种有序的方式向边缘端延伸。罗斯提到了近期出现的OpenClaw等原生运行于设备和AI PC上的智能体框架。这些框架终于为在设备端运行智能体提供了规范化的结构这是极具价值的真实进展而非昙花一现的噱头。数据层架构的重构与此同时数据策略也在随智能体AI的发展同步演进。罗斯警告称将标准数据存储系统简单挂载到AI计算集群上已经无法满足AI智能体对性能的要求。企业需要构建由向量数据库、图数据库和数据标注工具组成的知识与上下文层并且这些层级不能孤立存在必须与计算资源深度融合。性能瓶颈之一在于数据无法足够快地传输到GPU以完成计算罗斯说你花钱购置的GPU正在闲置等待数据到来。为降低这一延迟罗斯表示戴尔的AI数据平台现已接入Nvidia的Cuda-X接口使数据层服务能够直接以GPU的速度运行。掌握Token经济学与模型路由随着不同定价机制下的模型部署选项日益丰富IT领导者还需管理AI消费成本即便单个Token的成本预计会随时间下降。由于AI的使用成本不存在变得更低廉的路径企业必须将AI工作负载视作一场套利博弈罗斯说道。以基于规范驱动的开发方式为例——即让AI根据一份Markdown文档编写软件——他指出如果智能体框架产生大量编码任务并盲目地将其全部发送给顶级模型企业最终将面临高昂的账单。而借助模型路由企业可以将创建软件规范等复杂规划任务发送给昂贵的前沿模型同时将常规编码任务路由至本地运行的小型开源模型后者的运营成本仅为电力消耗。开发一款软件并进行规范驱动开发可能有四五种不同的经济路径最终达到最优的整体经济效益罗斯说。他补充道掌握模型路由将成为企业的核心竞争优势并有助于降低产品开发成本。人的因素归根结底智能体AI落地运营中最棘手的部分在于人的因素。罗斯将传统意义上的人类工作描述为一个工作容器其中包含日常事务、效率提升、协调配合和专业任务等各类工作。智能体无法承担一份完整的工作但在这个容器中它们能够高效完成特定类型的任务。戴尔已对公司内部6400个岗位进行了审计评估AI智能体将对员工队伍产生怎样的影响。我们意识到的第一件事是公司里每一个岗位都将发生变化罗斯说我正在把工作从岗位中抽离把东西从容器里拿走。如果容器现在只装了一半我是需要减少一半的员工还是把剩余空间填满更多内容我是否能够承担更多专业性工作事实上AI对职场的深远影响使得变革管理已成为IT领导层的核心职责之一。过去四个月里我有50%的时间都在处理人的问题罗斯说AI已经不再是一个技术讨论或投资回报率讨论的话题它现在更多是一个关于组织与人的动态变化的讨论。除非你完全理解如何引导身边的人去适应这些变化否则你根本无法有效使用这些工具。QAQ1企业部署AI智能体到底需要多少GPUA根据戴尔全球CTO约翰·罗斯的说法企业并不需要数千块GPU。戴尔内部规模最大的AI工作负载仅使用16块GPU却能支撑4万名员工使用。对于每个工作负载或智能体项目通常只需少量GPU有时半块就够。这是因为企业AI主要聚焦于推理而非训练推理所需算力远低于训练阶段。Q2企业应该如何控制AI智能体带来的Token成本A企业可以通过模型路由来优化成本。具体做法是将复杂的规划任务如软件规范制定路由至高性能的前沿模型而将常规编码等简单任务交由本地运行的小型开源模型处理后者的运营成本仅为电力费用。一个软件开发项目可能存在四五种不同的经济路径合理的模型路由策略能帮助企业实现最优的整体经济效益。Q3AI智能体对企业员工和组织架构会产生哪些影响A戴尔对公司内部6400个岗位进行审计后发现每一个岗位都将因AI智能体而发生变化。智能体会承接工作中的特定任务使原有工作容器出现空缺企业需要决定是缩减人员还是让员工承担更多专业性工作。戴尔CTO表示过去四个月他有50%的时间用于处理人的问题AI的推进已从技术议题转变为组织与人员动态管理的核心课题。