拒绝Token无效消耗，蚂蚁数科推出百灵企业版金融大模型：更快、更轻、更好-尧图网站设计

以OpenClaw为代表的自主执行智能体爆火标志着AI应用已从“对话交互”向“任务执行”加速演进。企业在加速拥抱的同时也面临着算力浪费、安全合规等多重挑战。如何让智能体真正实现规模化、可持续地落地成为产业界共同关注的核心议题。3月26日在中关村论坛未来产业创新发展论坛中蚂蚁数科大模型技术创新部总经理章鹏在演讲中表示OpenClaw的爆发将带来企业级AI范式革命推动大模型在产业场景的落地从“参数竞赛”走向“Token效能竞争”。蚂蚁数科大模型技术创新部总经理章鹏在中关村论坛演讲OpenClaw类智能体的快速普及反映了市场对自主执行型智能体的需求但在真实产业环境中其落地面临显著挑战由于缺乏对行业规则、业务流程的深度理解智能体在执行复杂任务时往往反复调用工具导致Token消耗远高于有效产出。据了解在一些高频调用场景中OpenClaw的Token消耗成本可达集成式Agent成本的数十倍甚至百倍这种高投入低产出的模式让其在产业规模化应用中面临可持续性难题。“大模型产业落地的下半场核心命题不是模型参数规模的竞争而是单位Token效能的持续提升。”章鹏认为企业应结合实际场景与需求选择大小模型结合的AI解决方案以更低算力成本实现更高业务价值。以金融场景为例该领域每天需处理海量高频低时延的任务——快速识别意图、提取关键信息、检索排序等等这些任务具备高并发、快响应、高精准要求传统行业推理大模型能力强大但在这些场景就像“杀鸡用牛刀”成本高昂响应偏慢资源浪费。“产业真正需要的是在确保专业、严谨与合规的前提下实现最优性价比与响应速度的AI解决方案。”章鹏表示。他认为大参数模型在复杂推理与深度分析方面表现效果更优小参数模型则在高频小任务场景的拥有更低延迟与更高性价比产业需要大小模型相结合的方案才能更高效低成本地解决真实场景问题。在中关村论坛上蚂蚁数科发布了轻量级金融专用模型Ling-DT-Fin-Mini-2.5这是Ling DT系列大模型的首款模型。据介绍Ling DT Fin Mini 2.5是一款轻量级MoE模型基于Ling 2.5最新的混合线性注意力架构针对金融领域高并发、低时延的任务场景进行优化在保持专业深度的同时可将推理成本压缩至可规模化部署的水位。它相比业界主流的同能力通用模型推理速度快100%处理相同任务量的硬件成本显著降低为金融机构带来切实的降本增效价值。事实上当AI智能体加速渗透产业核心场景、执行真实任务后大小模型相结合已经成为行业趋势。近期OpenAI便相继推出两款小模型GPT‑5.4 mini与nano主打低延迟与高性价比作为执行层子智能体主力。章鹏表示技术发展终将回归产业对效率的理性要求下一阶段的竞争中Token效能将成为衡量企业级AI价值的核心指标。蚂蚁数科将持续深耕企业级AGI进一步推出百灵企业版Ling DT大模型及其行业版加速智能体在企业级复杂场景的规模化落地。

拒绝Token无效消耗，蚂蚁数科推出百灵企业版金融大模型：更快、更轻、更好

相关新闻

黑苹果探险记：从零构建你的macOS兼容PC系统

零代码玩转OpenClaw：ollama-QwQ-32B自动化脚本生成教程

基于FFmpeg的跨平台图形用户界面LosslessCut

NBTExplorer：5分钟掌握Minecraft数据编辑的终极免费工具 [特殊字符]

三步实现QQ空间历史数据永久备份：GetQzonehistory开源工具完全指南

3分钟掌握绝地求生压枪秘籍：罗技鼠标宏完全配置指南

自动驾驶端到端感知：无高精地图的十年技术演进与工程实践

【C++】string类的认识与常用接口详解（一）

3种异常检测算法对比：One-Class SVM vs Isolation Forest vs LOF 性能实测

STM32F411RE与MCP3551高精度ADC应用指南

【RT-DETR涨点改进】26 跨平台SDK封装：从Python原型到C++生产级部署

【RT-DETR涨点改进】27 RT-DETR推理加速：从TensorRT到ONNX Runtime的零开销切换

STM32F411RE与MCP3551高精度ADC应用指南

【RT-DETR涨点改进】26 跨平台SDK封装：从Python原型到C++生产级部署

【RT-DETR涨点改进】27 RT-DETR推理加速：从TensorRT到ONNX Runtime的零开销切换

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

国产DSP FT-M6678 DDR3配置避坑指南：从PLL时钟到PHY寄存器，手把手调通你的第一块板

Coze与Dify对比指南：低代码AI应用开发从入门到实战