Mythos Model

Anthropic 内部标记为”过于危险而不宜全面发布”的前沿语言模型。

背景

Mythos 是 Anthropic 内部开发的前沿模型,据 Bloomberg 报道,该模型被公司内部安全团队标记为存在严重安全风险,不宜全面发布。Anthropic 此前曾向相关方警告该模型的风险性。

安全审计应用

尽管未公开发布,Mozilla 安全团队获准使用 Mythos 对 Firefox 浏览器进行系统性安全审计。结果:该模型共发现 271 个安全漏洞。Mozilla 表示,这些漏洞同样可以被顶级人类安全研究人员发现。

这一案例展示了前沿 AI 模型在安全审计领域的潜力——能够进行大规模、系统的代码审查,发现人类研究者可能遗漏的问题。

Project Glasswing(2026-04-07)

Anthropic 推出 Project Glasswing 计划,目标是利用 Mythos 模型自动发现和修复软件漏洞。该计划将 Mythos 的网络安全能力从纯研究推向实际安全工程应用。

Bruce Schneier 评价

知名安全专家 Bruce Schneier 撰文称 Mythos 为网络安全领域的”分水岭时刻”(watershed moment),认为 AI 驱动的漏洞发现将根本性改变安全行业的运作方式。来源:TechCrunch / Ars Technica。

安全争议

Mythos 遭未授权用户在私人论坛中访问,引发对前沿模型安全控制措施的进一步讨论。

未授权 Discord 组获得访问(2026-04-24)

一个未授权的 Discord 组获得了 Mythos 模型的访问权限。此事发生在 Mozilla 安全审计合作之后,表明 Anthropic 对前沿模型的访问控制存在漏洞。来源:TechCrunch / Hacker News。

实际效果被质疑过度炒作(2026-04-24)

独立开发者 xark.es 对 Mythos 在 Firefox 安全审计中的实际效果进行了独立测试,认为 Mozilla 公布的 271 个漏洞发现可能存在过度宣传。这一质疑为 Mythos 的安全审计能力评估提供了必要的平衡视角。来源:xark.es。

GPT-5.5 达到类似能力(2026-04-23)

OpenAI 发布 GPT-5.5(代号 Spud),XBow 安全团队测试发现该模型已具备类似 Mythos 级别的黑客能力,且已向公众开放使用。4 月 24 日 API 版本上线,GPT-5.5 Pro 同步推出。据 NYT 报道,GPT-5.5 新增了网络安全相关安全护栏。这一发展表明前沿模型的安全审计能力正在快速普及化,同时也引发对 AI 黑客能力公众可及性的担忧。

NHS 因 Mythos 安全担忧关闭 GitHub 仓库(2026-05-06)

英国国家医疗服务体系(NHS)命令技术负责人暂时封闭 GitHub 上数百个开源代码仓库,原因与高级 AI 和 Mythos 相关的安全担忧有关。维护者被要求在 5 月截止日期前完成更改。此事件表明 Mythos 的安全影响已从 AI 行业内部扩展到更广泛的开源生态和公共服务领域,AI 正在改变开源安全的基本假设。来源:The Register。

未授权访问持续调查(2026-05-04)

Anthropic 正在继续调查对 Mythos 的未授权访问事件。Mythos 是仅向选定公司、已审查组织和部分政府机构提供的受限网络安全 AI 模型。调查仍在进行中,访问控制缺陷的完整影响尚未完全评估。

Mozilla Firefox 安全审计:423 个漏洞修复(2026-05-07)

Mozilla 利用 Claude Mythos Preview 构建 Agentic AI 安全扫描流水线,在 Firefox 150 中发现并修复 271 个漏洞(含一些长达 20 年的旧 Bug),加上此前 Claude Opus 4.6 发现的 22 个,单月修复总量达 423 个,为 Mozilla 历史纪录的 5 倍。这是 Mythos 模型迄今最显著的实际工程应用成果。来源:The Decoder / Mozilla Hacks。

AISI 网络安全能力评估(2026-05-08)

AI Safety Institute(AISI)对 Claude Mythos Preview 进行了专门的网络安全能力评估。安全专家在 CNBC 采访中警告,该模型的网络攻击能力意味着”威胁已经到来”,呼吁加强 AI 安全治理。评估结果进一步证实 Mythos 级别的网络攻击能力不再是理论风险,而是现实存在。来源:CNBC。

XBOW 独立评估:漏洞发现能力确认但成本与精度需权衡(2026-05-14)

XBOW 对 Anthropic Mythos Preview 模型进行了独立评估,确认其在源代码审计和漏洞发现方面确实大幅领先现有所有 AI 模型。在原生代码漏洞发现和逆向工程方面表现出色,但在漏洞验证和判断力方面存在不足——有时过于保守导致漏掉真实漏洞,有时又过度报告。成本方面,Mythos 预计为 Opus 的 5 倍,XBOW 发现在固定 token 预算下,给予廉价模型更多时间也能达到类似效果。来源:SecurityWeek。

研究人员用 Mythos 突破 macOS 内存完整性保护(2026-05-15)

安全研究人员利用 Claude (Mythos) 构建了利用两个 macOS 漏洞的代码,仅用 五天就突破了 Apple 历时 五年开发的内存完整性强制保护(MIE)。这是 Mythos 在实际攻击场景中最具戏剧性的应用案例——AI 将攻防时间不对称性从”月级”压缩至”天级”,对传统安全开发周期构成根本性挑战。来源:The Verge。

Reuters:Mythos 引发的黑客能力恐慌可能被夸大(2026-05-20)

路透在 Mythos 发布一个月后回顾指出,外界早期对于其会显著放大黑客活动、导致“失控式”攻击扩散的担忧,目前看来有被夸大的成分。该观察并不否认 Mythos 在漏洞发现与利用辅助方面的真实能力,而是提示应区分“能力突破”与“现实世界攻击规模已经同步失控”这两个不同命题。对 Anthropic 和更广泛 AI 安全治理讨论而言,这是一个重要的平衡视角:前沿模型确实缩短了攻防时间差,但其社会影响仍取决于访问控制、运营约束和防御侧适应速度。来源:Reuters。

Glasswing 首月报告:30 天发现超 1 万个漏洞(2026-05-24)

围绕 Mythos / Project Glasswing 的新一轮报道宣称,其在首月运行中已发现超过 1 万个漏洞,并把修复速度提升到传统流程的约 10 倍。虽然部分报道措辞明显带有宣传色彩,但若与此前 Mozilla 审计、XBOW 评测和 Reuters 的平衡视角合并来看,一个更稳妥的结论是:Mythos 的真正结构性意义不只是“能不能找到顶级漏洞”,而是它正在把漏洞发现能力产品化、流程化,并开始影响漏洞修复吞吐量。来源:新浪财经 / 第一电动网 / 手机鳳凰網。

参见