RSI火了！AI递归自我改进引行业狂欢，国内厂商已悄悄摸到边？-尧图网站设计

RSI突然在AI圈火了“递归”这个词最近在AI圈子里突然火了。两家初创公司直接将其作为公司名许多实验室在路线图里加入了RSI递归的英文名recursive self - improvement即递归式自我改进。像AGI一样RSI正成为一个让人既兴奋又忐忑的行业暗号尽管大家对它的定义还未完全统一。什么是RSI简单来说RSI就是让AI自己训练自己。在技术界RSI一直被视为人工智能进步的主要标志之一与记忆、推理和多模态并列唯一的限制是算力人类在其中并非必要条件甚至连帮手都算不上。AI行业的狂热与RSI的可能狂欢这并非AI行业的第一次狂热。从2016年的AlphaGo到2023年的ChatGPT再到如今各家大模型参数军备竞赛AI行业的天性就是追逐下一个“改变一切”的东西。在雷科技AGIIDleikejiagi看来RSI可能就是下一场狂欢。RSI相关案例今年5月AI界知名研究员Richard Socher创办了一家叫Recursive Superintelligence的新公司名字直接就是RSI。他表示“我们的核心目标是构建真正意义上的递归自我改进超级智能整个研究的构思、实现和验证过程全部自动完成。”另一个案例是安德烈·卡帕西Andrej Karpathy推进的Auto - Research项目用智能体集群来训练语言模型让模型自己做简单的研究任务并改进自己。安德烈·卡帕西是传奇人物他在特斯拉做自动驾驶、在OpenAI做GPT都有出色成果。现在他全力投入RSI且以公开透明的方式推进还定期在推特上更新进展代码也在GitHub公开。不过他也表示目前工作还是在GPT - 2级别的小模型上迭代“还不是什么突破性研究暂时”但已带动大批研究者跟进。安德烈·卡帕西最近加入了Anthropic的预训练团队。Anthropic有Claude卡帕西有auto - research方法论两者结合大模型自训练循环若跑通就不是GPT - 2级别的小打小闹了。另一家叫Adaption的公司推出了AutoScientist工具目标是自动化前沿模型的训练过程逻辑与安德烈·卡帕西的auto - researchers一样训练agent做渐进式改进且Adaption野心更大想直接搞定全尺寸前沿模型的训练闭环。这两家代表了两种路线安德烈·卡帕西从底层逐块验证开源并在社区攒势能Adaption直接冲着商业化的大模型训练场景去落地意愿更强。两条路谁先跑通对行业影响不同。AI圈大佬对RSI的看法Google CEO桑达尔·皮查伊上个月在一档播客里谨慎承认“RSI是一个连续体我们确实都在进步。但如果按照大家描述RSI的方式那代表的是下一个量级的加速会有很多影响但我们还没到那一步。”今年1月Anthropic一位主导Claude Code开发的程序员称团队里接近100%的代码是Claude Code写的这是AI在写自己。Anthropic关于Mythos预览版本的内部调查显示18位工程师里有5位认为若配套系统改进这个版本的Mythos可替代一个L4工程师。但Claude也有弱点它在自我驱动方面较弱而自我驱动是RSI的根基。Georgetown安全与新兴技术研究中心CSET去年组织专家研究RSI专家评估出现分裂一部分人预期“超级智能爆炸”另一部分人预期进展慢且会触达瓶颈期。但他们共识是递归让未来难以预测。METR研究员Ajeya Cotra将RSI进程拆解成几个里程碑第一级“足够”是把人类完全移除后系统仍能做研究第二级“对等”是AI独立完成的研究和人类独立完成的研究质量相当第三级“超越”是AI独立系统表现超过人类与AI协作的系统。Ajeya Cotra判断我们离第一级很近但第二级何时到来未给时间表不过她推演一旦第二级到来后续加速会远超以往。国内厂商与RSI国内厂商很少公开喊RSI但在让AI自己改进自己方面其实已在不同路径上悄悄摸到边。比如DeepSeek花钱比OpenAI少一个数量级在很多推理任务上能正面竞争靠的是算法效率的极致优化。百度文心用强化学习驱动模型自我优化虽未用RSI之名但做的是同一件事。不过OpenAI和Anthropic的人才密度目前国内厂商比不了国内在RSI探索上仍处于跟随状态。但历史经验显示国内厂商在路径明确后的追赶速度惊人一旦可复现路径走通国内玩家的成本控制能力和落地场景密度会是被低估的变量。RSI面临的问题事实上AI自己生成的数据用于训练下一版AI质量会下降。RSI逻辑是AI生成好数据训练下一代AI使其更强但实际可能相反AI生成的数据会混入幻觉、偏见等循环几代后系统会塌这叫模型坍缩已有论文验证。此外RSI需要无限算力和全球开放协作的研究生态但现实中训练前沿模型成本高芯片产能、能源、优质数据有限出口管制和技术脱钩使AI研究圈子不流通基础条件难以满足。行业发展的观察整个行业过去五年先是大规模预训练让人陷入“参数崇拜”接着RLHF让人相信“价值观可以微调”现在RSI讲“机器自己跑完整个研发链条”的故事。每一步都让人类在决策链条中往后退这种退法不一定是坏事但不可逆。一旦环节被自动化接管人的直觉、经验、判断力会退化到那时我们可能都无法真正理解工具是如何造出来的。

RSI火了！AI递归自我改进引行业狂欢，国内厂商已悄悄摸到边？

相关新闻

AI 视频抽卡时代落幕，可编辑时代开启，创作者角色将从剪辑转向“模型导演”

AI“递归”热潮来袭：海外积极布局，国内厂商跟进但面临模型坍缩等挑战

告别官方限制：用TWRP和Magisk给你的老Pixel续命（Android 8.0 Oreo实战）

终极NCM格式转换指南：3分钟掌握网易云音乐解密技巧

用粒子群算法在MATLAB里自动找PID三个参数的最优解

Windows窗口置顶神器：三分钟掌握AlwaysOnTop高效工作法

多维聚合实战：超越GROUP BY的数据操作核心

企业级应用架构演进：从单体到微服务的治理

掌握跨平台直播分发：obs-multi-rtmp插件深度应用指南

从放大器选型反推：为什么你的无线模块用OQPSK而不用QPSK？一个硬件工程师的避坑指南

实战指南：基于快马平台生成可集成的流程图组件，告别单纯安装教程

Qwerty Learner：程序员如何在VSCode中边写代码边记单词的终极指南

从放大器选型反推：为什么你的无线模块用OQPSK而不用QPSK？一个硬件工程师的避坑指南

实战指南：基于快马平台生成可集成的流程图组件，告别单纯安装教程

Qwerty Learner：程序员如何在VSCode中边写代码边记单词的终极指南

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源