
Fable 5性能最强的通用模型6月9日Anthropic正式发布Claude Fable 5一款被定位为Mythos级的安全可用模型。这是Anthropic首次将Mythos级别的模型降级后向公众开放同时保留给政府合作方一个不受限制的版本Mythos 5。官方公告称其能力超过此前所有向公众开放的模型在软件工程、知识工作、视觉、科学研究等几乎所有测试基准上均达行业领先水平。任务越复杂、时间越长Fable 5相对其他模型的领先优势越大。此前的Claude Opus 4.8是Anthropic最强的公开可用模型但Fable 5已在多个维度实现超越。Stripe压缩两个月工程为两天Fable 5的实际表现让早期测试客户印象深刻。Stripe报告称Fable 5将数月的工程工作压缩到了几天内完成。在一个包含5000万行代码的Ruby代码库中该模型执行一次全代码库迁移原本需一整个团队手工操作两个月以上的工作Fable 5在一天内完成。在Cogeneo的FrontierCode评估中Fable 5在前沿模型中得分最高即使在中等努力模式下也不例外。GitHub测试负责人Mario Rodriguez表示这是测试过的任何Claude模型中最强的结果。Claude Fable 5在代理编码和原型设计方面明显进步。金融分析全面满分在知识工作领域Fable 5表现惊人。在Hebbia的高级推理金融基准测试中Fable 5得分高于其他模型在文档推理、图表解读和问题解决方面均有显著提升。IMC在交易分析评估中同样记录到Fable 5全面通过包括事实查询、概念推理、根本原因分析和预期价值分析。Fable 5还是视觉任务的新一代SOTA模型能从详细科学图表中提取精确数字能仅凭截图重建Web应用的源代码还能在仅凭视觉输入的情况下以最小辅助条件通关《宝可梦火红版》这在此前的Claude模型中需复杂辅助工具才能实现。Mythos 5的科学突破Mythos 5不仅在网络安全上领先在科学研究领域也潜力惊人。在药物设计方面Mythos 5将药物设计流程的部分环节加速约十倍。在一项测试中Mythos 5仅凭蛋白质设计和生物信息学工具无人工辅助就能匹配或超越熟练的人类操作员执行通常由科学家完成的所有任务14个蛋白质靶点中有9个产生了强烈的药物设计候选物目前正在研究中。在分子生物学领域Mythos 5是Anthropic第一个能持续产出新颖、令人信服的科学假设的模型。在与Opus级模型的双盲对比中科学家们约80%的情况下更偏好Mythos的分子生物学假设其中一个关于大肠杆菌蛋白的新型机制假设已被一个独立研究同一问题的实验室发表的研究所证实。Mythos 5还在一周多的半自主工作中完成了新颖的基因组学研究组装了跨越138个动物物种的数百万个单细胞数据设计并训练了一个自定义机器学习模型来识别在不同物种中执行相同功能的细胞。仅凭高层人类输入Mythos 5训练出的模型性能就超越了一篇近期发表于《Science》期刊的模型尽管小了100倍。长期记忆与自主性Fable 5能在长时间运行的任务中保持专注处理数百万token的上下文并利用自身的笔记改进输出。在玩卡牌构建游戏Slay the Spire时拥有持久文件存储记忆的Fable 5性能提升了3倍且更频繁地到达最终章节。Anthropic展示了Fable 5自主玩转Factorio的能力以及从物理第一性原理推导行星轨道运动并预测日食的能力该模型还能在浏览器CAD编辑器中设计完整的3D可打印模型。安全护栏5%会话的代价发布能力强大的模型有风险若Fable 5的网络安全能力被恶意使用可能造成严重损害。Anthropic为Fable 5配备了安全护栏机制当系统检测到敏感领域查询时会自动切换至Claude Opus 4.8进行响应。为尽快发布且保证安全Anthropic承认这些护栏保守地调整过约5%的正常会话会意外触发安全限制被系统拦截。他们表示正在努力改进护栏、减少误报但随着更强大模型即将在未来几个月推出这项工作显得更加紧迫。Mythos 5给美国政府的 无限制版全球最强网络安全能力对于一小部分网络防御者和基础设施提供商Anthropic还同步推出了Claude Mythos 5这是同一底层模型但解除了部分安全限制。Mythos 5将首先通过Project Glasswing计划与美国政府合作部署作为此前Claude Mythos Preview的升级版。Anthropic在公告中明确表示Mythos 5拥有全球最强的网络安全能力。该公司还表示将很快通过更广泛的可信访问计划扩大Mythos 5的获取范围。价格不到Mythos Preview一半Anthropic同时宣布了具有竞争力的定价策略Fable 5和Mythos 5的输入token定价为每百万10美元输出token为每百万50美元不到Claude Mythos Preview价格的一半。这一定价策略旨在扩大市场覆盖。早期用户反馈Cursor CEO Michael Truell称Claude Fable 5是CursorBench上的SOTA模型。它解锁了此前模型无法触及的长时间视野问题。GitHub首席产品官Mario Rodriguez表示对开发者来说是一个真正的进步。在早期测试中它在复杂的长时间视野编码任务上以自主性和可靠性超越了之前的基准。这对行业意味着什么Anthropic此前公开场合谨慎强调AI安全的渐进式方法。但Fable 5的发布表明他们正将最强大的模型推向更广泛的用户群体同时用安全护栏作为临时解决方案。这背后存在核心张力模型能力越强商业价值越大但被滥用的风险也越高。Anthropic选择中间路线不完全封禁也不完全开放用保守的护栏争取时间窗口同时为政府合作保留无限版。对于开发者而言若应用场景涉及敏感领域可能需为Fable 5的意外拦截做兼容性准备。对于整个AI行业而言Anthropic的分级开放策略可能很快会成为其他玩家的参考模板。