Anthropic 今日正式推出了其第五代 Claude 系列两款全新模型:面向通用市场的 Claude Fable5,以及专注于特定专业领域的 Claude Mythos5(现已结束预览阶段)。两款模型均基于同一基础模型构建,但在安全配置和应用场景上各有侧重。Claude Fable5在几乎所有主流测试基准中都斩获了最高分,在长时间、复杂的任务处理中优势尤为显著。在评估无助状态下解决真实 GitHub 任务的 SWE-Bench Pro 测试中,Fable5获得 80.3% 的分数。在更严苛的生产级编码基准 FrontierCode 上,它获得 29.3% 的得分。支付巨头 Stripe 表示,Fable5将原本需要5个月的工程工作缩短至几天;在一个拥有5000万行 Ruby 代码的代码库中,它仅用一天就完成了整个团队原本需要两个多月才能完成的迁移工作。Fable5在金融分析(Hebbia 基准测试)和图表解读上表现出色。IMC 交易集团表示该模型几乎全面通过了其交易分析评估。视觉方面,它能精准提取复杂的科学插图数据,并仅凭游戏截图就独立通关了《精灵宝可梦 火红》。Claude Mythos5 解除了网络安全等领域的限制,专门面向特定合作伙伴及美国政府(通过 Project Glasswing 项目)开放。在无需人工干预的盲测中,Mythos5能够自行选择结合位点、运行生物信息学工具并自我修复错误。在14个蛋白质靶点中,成功为9个产生了有效的候选药物。盲法对比显示,约80% 的情况下科学家更倾向于 Mythos5提出的分子生物学假设。Mythos5在无人工干预下连续工作超一周,编译了138种动物、数百万个细胞的单细胞数据,并训练出自己的机器学习模型。在 ExploitBench 基准测试中,Mythos5的得分从预览版的69% 提升至 78%。Fable5和 Mythos5的定价为 每百万输入代币(MTok)10美元,每百万输出代币50美元。在 Claude.ai 的网页订阅计划中,新模型将按照2倍使用量计费。Anthropic 在 Fable5中内置了一套创新的分类器降级机制:只要检测到涉及网络安全、生物、化学或“提炼(模型能力提取)”的危险提示词,系统会自动将请求路由到较弱的 Claude Opus4.8模型上(影响约不到5% 的会话),并在界面上通知用户。针对旨在构建前沿大模型的提示词,系统不会直接拦截,而是会隐蔽地通过提示修改、引导向量或 PEFT(参数高效微调)来限制其输出效果。在外部超过1000小时的测试中,测试人员未能找到通用的越狱方法,Anthropic 报告Fable5攻击任务的成功率为零。为此,Anthropic 还增加了30天的数据保留期以检测新型攻击。目前,Claude Fable5已通过Claude API和企业按量付费计划推出。在 Claude.ai 的订阅计划(Pro、Max、Team 等)中正在逐步部署:即日起至6月22日,订阅用户可免费体验 Fable5;自6月23日起,使用该模型将需要消耗使用点数(Credits)。官方承诺,一旦未来算力容量充足,会重新将其纳入常规订阅套餐中。
网友评论