卡神跳槽Anthropic:要搞“AI教AI“这件最危险的事!

发布时间:2026/5/21 6:50:37

卡神跳槽Anthropic:要搞“AI教AI“这件最危险的事! 2026年5月19日人工智能圈出了个大新闻——卡神安德烈·卡帕西宣布加入Anthropic公司。这位曾经的名人可不一般他不仅是OpenAI最早的成员之一还曾在特斯拉负责过AI部门在业内地位颇高。但这次跳槽的真正看点不在他的职位头衔而在于他要干的事情——一个被业内称为最危险的AI方向的工作。卡帕西到Anthropic后将在预训练团队负责人尼克·约瑟夫的带领下面组建新团队核心任务是用Claude模型来加速预训练研究。说得更直白一点他的工作就是让AI来优化AI自身的训练过程。在AI安全研究领域这个方向有一个正式名称叫递归自我改进。它的核心逻辑是AI系统不断优化自身训练流程实现能力自我提升。这个概念在学术界存在了几十年但直到最近才真正进入工程实践阶段。事情没这么简单。卡帕西的背景确实让他成为这个岗位的人选。2015年至2017年他在OpenAI做深度学习和计算机视觉研究2017年被马斯克招去特斯拉负责自动驾驶视觉团队把神经网络技术从论文推向了量产。2022年从特斯拉离职后他又短暂回到OpenAI2024年创办了自己的AI教育公司。值得关注的是卡帕西加入Anthropic的时机很微妙。就在一个月前Anthropic联合创始人Jack Clark发布长文预测到2028年底AI实现递归自我改进的概率约为60%。他列举了一系列数据AI在GitHub问题测试中的表现从2%提升到93.9%让AI优化小型模型训练任务的效率从2.9倍提升到52倍。这背后有一个无法回避的矛盾Anthropic一直以来的品牌叙事是AI安全优先而递归自我改进恰恰是AI安全社区长期最担忧的能力之一。批评者认为即使AI能自我优化每一代优化的效率可能只是线性甚至递减改善未必能产生指数级回报。更让人担心的是如果当前AI对齐技术准确率是99.9%在50代迭代之后可能降到95%500代后可能降到60%。在AI参与自身训练的循环中对齐约束能否可靠传递给每一代后继模型目前没有答案。Anthropic在回答这个矛盾时似乎走了一条最懂风险的人来做这件事的路子——同步推进能力研究和对齐研究试图用工程节奏跑赢失控时点。公司在研究纲要中还承诺会公开工作如何因新AI工具加速以及AI系统潜在递归自我改进的相关数据。眼下卡帕西加入Anthropic释放了一个信号AI产业的竞争重心正在从用更多算力训练更大模型转向让AI参与自己的训练过程。这条路潜力巨大也确实危险。

相关新闻