Anthropic网络安全模型Fable防护栏限制过严，研究人员纷纷抱怨-尧图网站设计

Anthropic于周二发布了其最新模型Fable将其定位为功能强大、备受期待的网络安全模型Mythos的公开限制版本。然而并非所有人都对这些限制措施感到满意多名网络安全研究人员和从业者已在网上公开表达不满。IBM X-Force知名安全研究员Valentina Chompie Palmiotti表示Fable会拒绝任何可能与网络安全沾边的请求甚至包括阅读一篇博客文章这样无害的任务。当某个提示触发防护栏时Fable会暂停对话并提示其安全措施已将此消息标记为涉及网络安全或生物学主题。这些防护栏的设置是为了降低Fable被用于开发恶意软件或破坏软件系统的风险——这是Anthropic长期以来的核心关切。对生物学内容的限制则源于对生物武器开发的类似担忧。今年4月Anthropic发布Mythos时将其使用权限制在少数公司和机构范围内并将这一计划命名为Project Glasswing旨在将该模型部署于保护关键软件与基础设施。上周Anthropic将Mythos的访问权限扩展至15个国家的数百个组织。尽管初衷良好许多网络安全专家仍对这些限制措施的随意性感到困惑。网络安全资深人士Matt Suiche向TechCrunch表示如果你让它编写安全代码它会认为这是网络安全相关工作而非软件工程最佳实践然后你就会被降级处理。据悉Fable在触发防护栏后会自动回退至Claude Opus 4.8版本。看起来是基于关键词匹配的凡是网络安全词汇范畴内的内容都会触发防护栏。Suiche目前是AI网络安全初创公司Tolmo的技术人员他同时表示但这也是可以理解的毕竟我们仍处于早期阶段他们还在持续调整防护栏机制。随着Anthropic和其他前沿模型公司与新一代网络安全公司的合作不断深入这些限制肯定会随时间推移而演进。在这类发布初期宁可多拦截一些也好过漏放然后再逐步放宽限制。另一位研究人员在X平台上抱怨称就连请求进行代码审查也会触发Fable的防护栏。Anthropic未立即回应置评请求。除模型内部的防护栏机制外Anthropic还要求网络安全专业人员申请加入网络安全验证计划。通过审核后申请者在使用Claude处理网络安全相关工作时所受的限制将相对减少。OpenAI也设有类似项目名为Trusted Access for Cyber。QAQ1Anthropic的Fable模型是什么和Mythos有什么区别AFable是Anthropic发布的最新模型是其功能强大的网络安全模型Mythos的公开限制版本。Mythos在发布初期仅向少数经过审核的公司和机构开放并通过Project Glasswing计划用于保护关键软件与基础设施而Fable则面向更广泛的用户群体但设有更严格的防护栏限制触发后会自动回退至Claude Opus 4.8版本。Q2Fable的防护栏为什么会拦截正常的网络安全工作请求AFable的防护栏采用基于关键词匹配的机制凡是涉及网络安全相关词汇的内容都会被触发甚至包括阅读博客文章、编写安全代码或请求代码审查等无害操作。这一机制的初衷是防止模型被用于开发恶意软件或生物武器但过于宽泛的拦截范围导致许多合法的网络安全工作受到影响。Q3网络安全专业人员如何获得更少限制地使用Fable或ClaudeAAnthropic为网络安全专业人员提供了网络安全验证计划Cyber Verification Program通过申请审核后用户在使用Claude处理网络安全相关工作时所受限制将相对减少。OpenAI也设有类似项目名为Trusted Access for Cyber供网络安全从业者申请更高权限的访问。

Anthropic网络安全模型Fable防护栏限制过严，研究人员纷纷抱怨

相关新闻

项目实训开发日志（五）

嵌入式开发实战：从芯片手册到稳定代码的避坑指南

新手必看：企业微信 RPA 连接器 API 选择与避坑

Nine Patch Mesh插件：Godot中创建可伸缩3D网格的完整教程

AI Agent开发必看：从入门到实战，手把手教你成为行业大神！

GPT4Free LMArena模块故障排查：5个步骤彻底解决AI模型访问问题

在Windows上无缝安装安卓应用：APK安装器完全指南

STL缩略图：Windows资源管理器中3D模型的视觉革命

高效AI图层分离工具：layerdivider如何革新数字艺术工作流

从键盘控制器到系统管家：手把手带你理解x86平台Embedded Controller (EC)的演进与通信机制

如何快速提升画质：Waifu2x-Extension-GUI终极使用指南

从PNG到游戏UI：Alpha预乘（Premultiplied Alpha）的利与弊，你的纹理用对了吗？

从放大器选型反推：为什么你的无线模块用OQPSK而不用QPSK？一个硬件工程师的避坑指南

实战指南：基于快马平台生成可集成的流程图组件，告别单纯安装教程

Qwerty Learner：程序员如何在VSCode中边写代码边记单词的终极指南

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源