一文看懂 Anthropic《AI指数级发展政策》:当AI跑得比监管更快

发布时间:2026/6/12 0:03:01

一文看懂 Anthropic《AI指数级发展政策》:当AI跑得比监管更快 2026年6月10日Anthropic CEO Dario Amodei发表了一篇题为《AI指数级发展政策》Policy on the AI Exponential的长文直指一个正在加速逼近的核心矛盾**AI能力的指数级增长与传统政策制定流程之间已经形成了一道危险的时差鸿沟**。这道鸿沟有多宽Amodei在文章中以亲身经历佐证几年前AI模型连一句连贯的代码都写不出来到2026年Anthropic自己的Claude Mythos Preview已经能在每个主流操作系统和浏览器中发现数千个高危漏洞。再过一两年AI就有可能进化成一个数据中心里的天才国度。而在国会需要数年时间才能完成立法的周期里AI早已从一个有趣的玩具升级成了汇聚天才的国度。面对这种根本性的速度错配Amodei提出的方案不再是过去的自愿披露和自律——他明确表示**透明度已经不够用了我们需要更严肃、更具约束力的监管**。与此同时文章发布的时间点也耐人寻味。就在前一天Anthropic刚刚发布了新一代旗舰模型Claude Fable 5和Mythos 5——这是他们史上最强、同时也是风险最高的公开模型。换句话说Amodei一边警告自家模型也很危险一边加快了商业化步伐。这种两条腿走路的姿态也正是理解这份政策文件的核心视角之一。一、两大框架从防止失控到谁买单整份政策文件的核心由两个相辅相成的政策框架构成覆盖了AI治理的一体两面技术安全和经济分配。 先进AI框架给政府叫停的权力先进AI框架Advanced AI Framework是整份文件中最具冲击力的部分。Amodei明确呼吁当某个前沿AI模型在强制性安全测试中不过关时美国政府应当拥有合法的权力来阻止或撤回其部署——而且这种权力超越了现行法律和国会已有提案所赋予的一切权限。具体而言Anthropic建议监管应当覆盖四类灾难性风险生物风险AI加速药物研发的能力同样可能被恶意利用让攻击者以更低的成本和门槛研发生物武器。网络风险前沿AI模型已具备大规模发现高危软件漏洞的能力关键基础设施如医院和能源网络面临前所未有的防护压力。失控风险当AI系统越来越强大它们可能出现超出开发者控制之外的行为。自动化研发AI正在自动化AI本身的研发这反过来又会加速前三类风险。这些监管规则并非普适——它们只适用于训练算力超过10²⁵次浮点运算的模型或者由AI业务年收入超过5亿美元/年研发投入超10亿美元的公司开发的模型。换句话说Amodei的目标非常明确只监管最强大的模型和最头部的大厂。监管模式上Amodei直接将AI与航空业类比前沿AI模型就像飞机一样必须经过技术测试和审计如果它们达不到高标准的安全要求政府应当像FAA叫停不安全飞机那样阻止或撤销它们的发布。此外考虑到加州、科罗拉多等多个州已经出台了各自的AI监管法律Anthropic明确表示除非国会能制定出至少与自身提案同等力度的联邦法律否则联邦政府不应架空各州已立法的监管规则。这种至少不比州法弱的立场既是对企业层级监管呼声的呼应也是对联邦层面立法缓慢的现实警觉。 经济政策框架AI取代工作后谁负责如果说先进AI框架回答的是如何防止AI干坏事那么经济政策框架Economic Policy Framework回答的则是AI干了很多工作之后人怎么办。Amodei敦促国会和各州政府对失业保险制度进行现代化改革以应对大规模失业的现实前景。他认为长期的AI性失业不只是一件不理想的事而且本身就是一种危险因此建议考虑全民基本收入和就业激励等收入支持措施。与这一框架相配套Anthropic宣布提供3.5亿美元的新资金用于支持劳动力转型和再培训等相关项目。二、暂停机制协调而非单边投降除了上述两大框架之外Anthropic还抛出了一个更具争议性的设想行业应当建立协调机制在风险过高时集体暂停或延缓前沿AI的开发。这一提议的核心逻辑在于过去Anthropic一直采用单方面暂停的方式但如果只有自己停下、而竞争对手继续狂奔这种自我约束在商业上难以为继。因此只有在全球头部AI实验室之间建立起可验证的、可信的协调性暂停——确保没有坏玩家借机偷跑——这一机制才可能真正落地。这一构想与Anthropic在今年2月对自身《负责任扩展政策》Responsible Scaling PolicyRSP的大幅修订一脉相承。在RSP 3.0中Anthropic正式删除了此前标志性的if-then单边暂停条款转而将安全承诺拆分为两大部分1无论外界情况如何自己都能确保履行的承诺2需要行业与政府协同推进的建议方案。简单来说Anthropic从我一个人停下来转向了要停大家一起停——这不仅是一种战略调整也是对公司自身商业可行性的务实考量。三、争议与回声真诚呼吁还是战略性渲染焦虑这份政策文件一经发布便引发了截然不同的两极反应。支持方先行者的自省包括著名AI学者Andrej Karpathy在内的支持者认为Anthropic正视自身产品的风险、主动推动具有约束力的政府监管是行业领导力的体现。尤其值得称道的是Anthropic在迭代《负责任扩展政策》时坦率承认了过去RSP 1.0和2.0的局限——能力阈值的模糊性和单方执行的不可行性——并据此重构了框架。这种自我否定式的坦诚在AI公司中极为罕见。质疑方企业利益的自利包装批评者的声音同样尖锐。有观点认为Amodei的文章并非技术报告更像是一场精心包装的战略公关——通过渲染AI太危险为大厂的竞争优势和IPO估值制造有利叙事。不少网友直接将其类比为现代版的《不扩散核武器条约》指出渲染焦虑、囤积资源本身就是一种争夺主导权的策略。OpenAI对此也发表了措辞谨慎的声明强调决定AI创新节奏的决定不应由任何一家实验室、公司或特殊利益集团做出而是应当由民主政府——而非私营公司——最终制定规则。更尖锐的批评点在于Anthropic在2026年2月才刚删除了自家的单边安全红线两个月后又高调发布一篇呼吁行业暂停的论文——这在部分观察者眼中构成了明显的前后矛盾难免让人对政策主张的真实诚意打上问号。还有一点不容忽视Anthropic本身正在与OpenAI竞速IPO估值有望接近1万亿美元。在这样一个敏感节点主动推动监管究竟是出于安全伦理驱动还是意在抬高行业准入门槛、限制竞争对手的发展空间这个问题有待时间去回答。四、双重责任企业还在往前走尽管争议不断但从实践来看Anthropic确实在一边呼吁刹车一边继续高速前进。就在政策文件发布前一天他们发布了史上最强的商用模型Claude Fable 5而其内部研究机构也已承诺将与行业合作探索可行的暂停机制。面对外界言行不一的质疑Amodei的回答颇具深意。在被问及是否将自己类比为AI界的奥本海默时他的回应显得克制而清醒奥本海默被视为一个失败者是一个本不应存在的案例。要实现一个好的结果制度必须有制衡。这句话或许也恰好点明了《AI指数级发展政策》背后最核心的态度没有人能单方面决定AI的未来越是强大的技术越需要它之外的制衡力量。五、写在最后AI跑在政策前面然后呢《AI指数级发展政策》之所以重要不是因为它已经给出了最终答案而是因为它让人们意识到AI能力与监管之间的差距已经从理论担忧变成了实际风险。从赋予政府阻止危险模型发布的法理权到推动劳动力市场的结构性变革再到呼吁全球AI行业建立协调性的暂停机制——Amodei的每一条建议都同时牵动着技术可行性、经济成本、政治意志和国际信任等多重变量而这些变量之间往往存在深层矛盾。AI发展的速度还在继续加快。当它可以自主发明新的科学理论、自主提升自己的智能、自主决定攻击还是防御时我们今天所讨论的这些框架是否仍足够有效政策文件里没有给出最终答案但至少它把一个迫切的问题清晰地摆上了桌面当火车跑得比轨道铺设快得多的时候我们还有多少时间来做决策获取更多AI咨询、一人公司、创业读书笔记、Openclaw、Claude Code实战干货欢迎关注我「Rubin智造社」

相关新闻