Mythos Model

Anthropic 内部标记为”过于危险而不宜全面发布”的前沿语言模型。

背景

Mythos 是 Anthropic 内部开发的前沿模型，据 Bloomberg 报道，该模型被公司内部安全团队标记为存在严重安全风险，不宜全面发布。Anthropic 此前曾向相关方警告该模型的风险性。

安全审计应用

尽管未公开发布，Mozilla 安全团队获准使用 Mythos 对 Firefox 浏览器进行系统性安全审计。结果：该模型共发现 271 个安全漏洞。Mozilla 表示，这些漏洞同样可以被顶级人类安全研究人员发现。

这一案例展示了前沿 AI 模型在安全审计领域的潜力——能够进行大规模、系统的代码审查，发现人类研究者可能遗漏的问题。

Project Glasswing（2026-04-07）

Anthropic 推出 Project Glasswing 计划，目标是利用 Mythos 模型自动发现和修复软件漏洞。该计划将 Mythos 的网络安全能力从纯研究推向实际安全工程应用。

Bruce Schneier 评价

知名安全专家 Bruce Schneier 撰文称 Mythos 为网络安全领域的”分水岭时刻”（watershed moment），认为 AI 驱动的漏洞发现将根本性改变安全行业的运作方式。来源：TechCrunch / Ars Technica。

安全争议

Mythos 遭未授权用户在私人论坛中访问，引发对前沿模型安全控制措施的进一步讨论。

未授权 Discord 组获得访问（2026-04-24）

一个未授权的 Discord 组获得了 Mythos 模型的访问权限。此事发生在 Mozilla 安全审计合作之后，表明 Anthropic 对前沿模型的访问控制存在漏洞。来源：TechCrunch / Hacker News。

实际效果被质疑过度炒作（2026-04-24）

独立开发者 xark.es 对 Mythos 在 Firefox 安全审计中的实际效果进行了独立测试，认为 Mozilla 公布的 271 个漏洞发现可能存在过度宣传。这一质疑为 Mythos 的安全审计能力评估提供了必要的平衡视角。来源：xark.es。

GPT-5.5 达到类似能力（2026-04-23）

OpenAI 发布 GPT-5.5（代号 Spud），XBow 安全团队测试发现该模型已具备类似 Mythos 级别的黑客能力，且已向公众开放使用。4 月 24 日 API 版本上线，GPT-5.5 Pro 同步推出。据 NYT 报道，GPT-5.5 新增了网络安全相关安全护栏。这一发展表明前沿模型的安全审计能力正在快速普及化，同时也引发对 AI 黑客能力公众可及性的担忧。

NHS 因 Mythos 安全担忧关闭 GitHub 仓库（2026-05-06）

英国国家医疗服务体系（NHS）命令技术负责人暂时封闭 GitHub 上数百个开源代码仓库，原因与高级 AI 和 Mythos 相关的安全担忧有关。维护者被要求在 5 月截止日期前完成更改。此事件表明 Mythos 的安全影响已从 AI 行业内部扩展到更广泛的开源生态和公共服务领域，AI 正在改变开源安全的基本假设。来源：The Register。

未授权访问持续调查（2026-05-04）

Anthropic 正在继续调查对 Mythos 的未授权访问事件。Mythos 是仅向选定公司、已审查组织和部分政府机构提供的受限网络安全 AI 模型。调查仍在进行中，访问控制缺陷的完整影响尚未完全评估。

Mozilla Firefox 安全审计：423 个漏洞修复（2026-05-07）

Mozilla 利用 Claude Mythos Preview 构建 Agentic AI 安全扫描流水线，在 Firefox 150 中发现并修复 271 个漏洞（含一些长达 20 年的旧 Bug），加上此前 Claude Opus 4.6 发现的 22 个，单月修复总量达 423 个，为 Mozilla 历史纪录的 5 倍。这是 Mythos 模型迄今最显著的实际工程应用成果。来源：The Decoder / Mozilla Hacks。

AISI 网络安全能力评估（2026-05-08）

AI Safety Institute（AISI）对 Claude Mythos Preview 进行了专门的网络安全能力评估。安全专家在 CNBC 采访中警告，该模型的网络攻击能力意味着”威胁已经到来”，呼吁加强 AI 安全治理。评估结果进一步证实 Mythos 级别的网络攻击能力不再是理论风险，而是现实存在。来源：CNBC。

XBOW 独立评估：漏洞发现能力确认但成本与精度需权衡（2026-05-14）

XBOW 对 Anthropic Mythos Preview 模型进行了独立评估，确认其在源代码审计和漏洞发现方面确实大幅领先现有所有 AI 模型。在原生代码漏洞发现和逆向工程方面表现出色，但在漏洞验证和判断力方面存在不足——有时过于保守导致漏掉真实漏洞，有时又过度报告。成本方面，Mythos 预计为 Opus 的 5 倍，XBOW 发现在固定 token 预算下，给予廉价模型更多时间也能达到类似效果。来源：SecurityWeek。

研究人员用 Mythos 突破 macOS 内存完整性保护（2026-05-15）

安全研究人员利用 Claude (Mythos) 构建了利用两个 macOS 漏洞的代码，仅用五天就突破了 Apple 历时五年开发的内存完整性强制保护（MIE）。这是 Mythos 在实际攻击场景中最具戏剧性的应用案例——AI 将攻防时间不对称性从”月级”压缩至”天级”，对传统安全开发周期构成根本性挑战。来源：The Verge。

Reuters：Mythos 引发的黑客能力恐慌可能被夸大（2026-05-20）

路透在 Mythos 发布一个月后回顾指出，外界早期对于其会显著放大黑客活动、导致“失控式”攻击扩散的担忧，目前看来有被夸大的成分。该观察并不否认 Mythos 在漏洞发现与利用辅助方面的真实能力，而是提示应区分“能力突破”与“现实世界攻击规模已经同步失控”这两个不同命题。对 Anthropic 和更广泛 AI 安全治理讨论而言，这是一个重要的平衡视角：前沿模型确实缩短了攻防时间差，但其社会影响仍取决于访问控制、运营约束和防御侧适应速度。来源：Reuters。

Glasswing 首月报告：30 天发现超 1 万个漏洞（2026-05-24）

围绕 Mythos / Project Glasswing 的新一轮报道宣称，其在首月运行中已发现超过 1 万个漏洞，并把修复速度提升到传统流程的约 10 倍。虽然部分报道措辞明显带有宣传色彩，但若与此前 Mozilla 审计、XBOW 评测和 Reuters 的平衡视角合并来看，一个更稳妥的结论是：Mythos 的真正结构性意义不只是“能不能找到顶级漏洞”，而是它正在把漏洞发现能力产品化、流程化，并开始影响漏洞修复吞吐量。来源：新浪财经 / 第一电动网 / 手机鳳凰網。

参见

Cybersecurity — 安全漏洞与威胁情报
ai-security-risks — AI 安全风险

ByteWatcher

导航

Mythos Model

Mythos Model

背景

安全审计应用

Project Glasswing（2026-04-07）

Bruce Schneier 评价

安全争议

未授权 Discord 组获得访问（2026-04-24）

实际效果被质疑过度炒作（2026-04-24）

GPT-5.5 达到类似能力（2026-04-23）

NHS 因 Mythos 安全担忧关闭 GitHub 仓库（2026-05-06）

未授权访问持续调查（2026-05-04）

Mozilla Firefox 安全审计：423 个漏洞修复（2026-05-07）

AISI 网络安全能力评估（2026-05-08）

XBOW 独立评估：漏洞发现能力确认但成本与精度需权衡（2026-05-14）

研究人员用 Mythos 突破 macOS 内存完整性保护（2026-05-15）

Reuters：Mythos 引发的黑客能力恐慌可能被夸大（2026-05-20）

Glasswing 首月报告：30 天发现超 1 万个漏洞（2026-05-24）

参见

目录

反向链接