
【导语近期AI圈热闹非凡GPT5.5、Claude Mythos等相继发布。Anthropic因AI接近“自己造自己”临界点呼吁停止研究OpenAI后训练团队负责人Yann Dubois则从微观视角给出了对AI进化的独特见解揭示了AI发展的现状、瓶颈与未来方向。】AI逼近“自我造己”临界点Anthropic呼吁停研Anthropic内部数据显示AI正在加速自身发展通往递归自我改进的路径或已浮现意味着AI正在接近「自己造自己」的临界点。这一进程比Anthropic预想的更快因此该机构呼吁减缓或暂停AI研究。OpenAIAI进化刚过合格线能力增长线性但体验离散OpenAI后训练团队负责人Yann Dubois在访谈中表示AI能力的增长是线性、连续的但用户体验到的「有用性」却是离散、跳跃的。在达到某个「可靠性阈值」之前AI只是个玩具一旦跨过它就成了能托付工作的员工且会自我加速。OpenAI在去年12月左右跨过了这道坎。此外AI构建更像「手艺」而非「科学」最终胜出的可能是类似炼金术的「flare直觉/灵感」。他还提出「最后一公里的AI红利」认为如果冻结所有模型只靠做垂直应用Harness其实已经能实现AGI瓶颈在于「权限、连接和数据」。三重动力推动AI加速强化学习转型升级AI出现「阶梯式跃迁」有多重原因。首先跨过「可靠性门槛」后AI可「真上岗」。其次模型变强会加速研发本身如在编程场景中模型能成为研究者的搭档实现「以AI养AI」Anthropic内部人均代码贡献量大幅提升。第三个推动力是强化学习的「转型升级」从只优化「有标准答案的题」转变为优化「用户觉得真有用的东西」从刷题选手向职场打工人进化。AI构建似手艺活可靠性提升是难题走进真实世界AI可靠性提升成了难题。Dubois给出「概率模型」指出提升可靠性就是降低「每两分钟出错率」这是AI智能体固有的难题。这也说明AI构建更像「手艺活」先靠经验、直觉、试错做出东西能用后再补科学解释与方法论。例如ChatGPT公开用RL时Dubois起初认为用监督微调就行但后来发现模型规模跨过一定水平RL会突然好用只是代价高昂。垂直应用潜力大持续学习成瓶颈对于垂直场景的Harness短期内能提升可靠性但需随着模型变强反复重调做通用Harness基本走不通。若冻结现有模型打磨Harness并训练很多领域能感受到AGI的味道。然而「持续学习」仍是难题目前模型起点高但后续难以持续提升。创业公司在垂直应用领域仍有很大空间真正的瓶颈在于「权限、连接和数据」等最后一公里的问题。编辑观点AI发展迅速但也面临诸多挑战Anthropic的警告与Dubois的见解为行业敲响警钟也指明方向未来需平衡发展与风险突破持续学习等瓶颈。