
DeepMind 的 Shane Legg 和 Marcus Hutter 合写了一篇论文标题直接得让人不适——《From AGI to ASI》。从通用人工智能到人工超级智能。不是如果是怎么。Legg 是 DeepMind 联合创始人2007 年和 Hutter 一起提出了机器智能的形式化定义。Hutter 是 AIXI 的创始人那个在理论上不可计算但定义了智能极限的数学框架。这两个人凑在一起写从 AGI 到 ASI不是科幻作家在头脑风暴而是通用智能理论的奠基人在画地图。论文的核心论点可以压缩成一句话AGI 不是终点而是起点。人类级智能的引入不会是一次性变革而是一系列变革的开端。真正需要准备的不是某个奇点时刻而是持续数十年的加速与摩擦的博弈。一、ASI 不是更聪明的 ChatGPT是比一万个专家加起来还强论文对 AGI 和 ASI 的定义很精确AGI约等于中位数人类的通用智能。不是爱因斯坦是一个能完成大多数日常认知任务的普通人。ASI在几乎所有人类感兴趣的领域和任务上远超数万名协调良好的专家级人类团队在 10 年内、使用 2010 年技术水平能达成的成就。注意这个定义里埋了几个狠词“数万名专家”——不是比一个人强是比一个大型组织的集体智慧强。“10 年”——不是更快地做完同样的事是做完人类需要十年才能做完的事。“2010 年技术”——假设这些专家没有 AI 辅助用传统工具工作。ASI 的存在形式也很关键论文认为它不是单一实体可能是数百万实例的集体系统。这和好莱坞电影里的一个超级 AI 大脑完全不同——更像是一个由无数智能体组成的生态系统各自专业化通过协调形成超越任何个体的集体能力。二、四条路径Scaling、范式转移、递归改进、多智能体论文用相当大的篇幅讨论了从 AGI 到 ASI 的四条路径而且明确指出它们不是互斥的——可能同时发生互相加速。路径一规模化Scaling最直接的路线继续过去十年的指数增长。更大模型、更多数据、更多算力、更多实例、更快运行。论文给出的一个核心估算有效算力每年增长约 10 倍。硬件性价比 1.5× × 投资增长 2.5× × 算法效率 3× 10×/年。如果这个趋势持续5 年后就是 10 万倍的算力。关键问题纯粹数量扩展是否足够某些问题如 NP-hard 问题可能需要质变突破而不仅仅是量变。论文没有给出确定答案只是指出这是一个当前的开放研究问题。路径二算法范式转移Paradigm Shifts区别于演化当前范式的增量改进范式转移是剧烈偏离现有架构的根本性创新。论文列举了一些可能的演化方向测试时动态计算、持续学习、无限工作记忆、线性时间架构如 Mamba。但真正的范式转移——论文坦诚地承认——本质不可预测。真正的范式转变的定义就是无法从当前框架预见。这是论文里非常诚实的一句话。它没有假装知道下一个重大突破是什么。路径三递归自我改进Recursive Improvement这是 AGI→ASI 讨论中最激进的路径。AI 加速 AI 研发→产生更强 AI→进一步加速研发正反馈循环。论文区分了四种风味基因型代码/架构/硬件的自我修改文化型数据驱动的改进合成数据、自动数据集策划、搜索蒸馏社会型专业化分工提升集体效率硬件型AI 设计更优芯片和制造工艺增长动力学可能从指数增长→超指数双曲线增长→理论上有限时间内无限增长奇点。但论文也指出关键不确定性递归改进是快速熄灭还是持续加速资源需求是否指数爆炸涉及物理操作的改进芯片制造无法任意加速——你不可能让晶圆厂以 1000 倍速度运行。路径四多智能体集体Multi-Agent Collectives大量 AGI 智能体通过协调/自组织形成复杂适应系统集体涌现超级智能。论文提出了三种组织形式设计型完全自动化的公司/机构“Group Agents”市场型虚拟智能体经济通过价格信号协调自组织型进化压力和市场动态驱动的分布式结构这个路径的核心洞察是绕过单一架构的瓶颈。一个智能体的上下文窗口有限但 1000 个智能体各自专长不同领域通过协调形成的集体能力可能远超任何个体。这和人类社会的分工逻辑一致——但数字智能的分工速度和带宽是人类社会的数量级倍数。三、数字智能的六大降维打击优势论文用 Table 1 系统列出了数字智能相比生物智能的六大优势所有优势都随算力增加而放大优势含义人类对比输入/输出速度秒级摄入多本书籍生物感官和运动神经速度受限内部处理速度更多算力 更快计算或更多并行神经元毫秒级进化无法快速改变工作记忆容量可记忆互联网大部分内容人类工作记忆约 4-7 个组块基质独立性可在不同计算机间迁移、分布式运行绑定于特定生物身体无损复制复制源码记忆状态任意备份/暂停/恢复繁殖和知识传递高度有损学习经验的高带宽共享同构实例间共享原始学习信号如平均梯度通过语言等低带宽瓶颈压缩知识这六个优势合起来意味着什么论文没有明说但 implication 很清楚如果数字智能在速度、记忆、复制、协作上都比人类强几个数量级那么它的文化进化速度可能是人类社会的指数倍。人类花了几千年才建立的科学体系数字智能可能在几十年内重建并超越。但论文也引用了 N. Lawrence 的具身因子论点作为 counterpoint高 I/O 带宽可能削弱形成深层抽象和内部世界模型的必要性。如果可以直接查询所有信息可能不需要像人类那样通过压缩经验来形成直觉。四、六堵高墙数据、算力、物理、抽象、对齐、复杂性论文在讨论完路径后笔锋一转列出了六大瓶颈Table 4。这些不是能不能到 ASI的问题而是到 ASI 的过程中会慢多少的问题。1. 数据瓶颈高质量人类文本数据预计本世纪末耗尽。AGI 级模型可能通过高保真模拟和合成数据克服但合成数据质量能否突破仍是开放问题。如果 AGI 自己生成的数据质量不够高scaling 路径会率先撞到墙。2. 计算资源限制能源、硬件制造、自然资源的经济和物理约束。论文没有具体计算但指出如果有效算力继续 10×/年增长能源需求会快速接近全球电力供应的显著比例。这不是不可能是需要准备——需要更高效的硬件、更多的能源基础设施、更优的算法效率。3. 算法效率收益递减保持指数研究进步需要指数经济投入Bloom et al., 2020。这是经济学层面的瓶颈——不是技术上不能而是经济上可能无法持续无限投入。4. 物理世界交互瓶颈物理实验无法任意加速。制造、能源生产、材料科学受物理定律约束。即使纯数字研究者可以加速涉及物理操作的改进需要等待真实世界的反馈。这主要限制递归改进硬件改进和多智能体物理部署的路径。5. 抽象障碍Abstraction BarrierAI 可能形成与人类根本不同的抽象导致沟通、对齐、合作困难。想象一个数学家的思维方式和一个音乐家的思维方式——现在把这个差异放大 1000 倍。ASI 的抽象可能对人类完全陌生这将严重阻碍人机协作和多智能体协调。6. 对齐与控制挑战确保 ASI 目标与价值观与人类兼容。这是跨所有路径的根本性挑战。递归改进可能放大初始对齐失败——如果第一代 AGI 的价值观有微小偏差第二代可能把这个偏差放大到不可收拾。五、渐进式革命不是奇点爆炸论文最重要的一个论点可能也是最容易被忽视的一个“More apt might be the prospect of a series of transformative societal changes caused by AI-enabled progress and breakthroughs across many areas of science and technology.”ASI 不是一夜之间天翻地覆的奇点事件。它更像工业革命、信息革命——持续数十年的多波变革。每次 AI 能力提升都引发社会调整调整过程本身成为下一波进步的背景。这个论点的预测含义是需要大规模跨学科、全球范围的努力来准备而不是针对单一奇点时刻做预案。这是一个更务实但也更复杂的应对策略——因为渐进式意味着变革不是一次性发生的而是持续渗透到社会的每个毛细血管。六、理论锚点AIXI 作为不可触及的上限论文在开头和结尾反复引用 Marcus Hutter 的 AIXI 框架。AIXI 是机器智能的理论极限在所有可计算环境中最大化期望累积奖励。但它不可计算——只能由越来越强大的 ASI 从下方逼近。Hutter 的观点论文第 8 节引述是AIXI 是我们当前对机器智能极限的最佳理解。即使它不可计算其理论性质为理解智能能走多远提供了一个锚点。就像热力学定律为内燃机工程提供了理论边界AIXI 为 AI 发展提供了理论边界。Hutter 在 2012 年的《Universal Artificial Intelligence》中描绘了一个愿景数字智能 inhabiting 纯计算虚拟世界物理世界仅用于获取算力资源。论文提到这个愿景时没有评价它是否现实只是把它作为一个可能的未来路径列出来。七、为什么这篇论文重要它来自理论奠基人不是智库的政策报告不是科技公司的公关稿而是通用智能理论的创始人Legg Hutter在学术框架内的严肃推演。它诚实地承认不确定性论文没有给出AGI 将在 2027 年到来或ASI 将在 2035 年到来这样的预测。它反复使用开放问题“不确定”不可预测这样的词。在一个充满炒作的领域这种诚实本身就是稀缺品。它把讨论从会不会转到怎么准备无论四条路径的哪条更可能无论六大瓶颈的影响是大是小论文的结论都是需要准备——“大规模跨学科、全球范围的努力”。它打破了单步跳跃的迷思AGI 不是终点是起点。这个框架比奇点论更复杂但也更现实。八、工程师视角我们能做什么论文的开放研究问题列表里有几条特别对工程师胃口如何量化测量 AI 研发自动化程度——需要开发指标追踪 AI 对 AI 研究的贡献比例能否建立递归改进缩放定律——从早期数据点预测自我改进曲线的饱和点测试时计算扩展的极限在哪里——链式思考、搜索、规划的收益递减点何种多智能体组织形式最优——中央集权 vs 市场式 vs 自组织式这些问题不是哲学思辨是可以动手做的工程研究。如果有人在读这篇论文后开始追踪AI 对 AI 研究的贡献比例这个指标那这篇论文就实现了它的一部分目标。论文From AGI to ASI. Tim Genewein et al., Google DeepMind. arXiv:2606.12683.#AGI #ASI #DeepMind #人工智能 #超级智能 #ShaneLegg #MarcusHutter #技术演进 #论文解读 #AI伦理