Claude Mythos Preview 安全研究：27 年漏洞发现与 AI 安全新范式

2026-04-09 约 5172 字预计阅读 13 分钟

学习目标：看懂 Anthropic「玻璃翼计划（Project Glasswing）」+ Claude Mythos Preview 这次安全披露到底意味着什么——AI 为什么突然能挖出 27 年的老漏洞、漏洞链是怎么串起来的、以及「不公开发模型、只给白帽优先」这套打法背后的安全逻辑，并用 OpenBSD / Linux 两个例子看实测。下面各级 §标题即目录（TOC），可按需跳读。

§1 视频概述

1.1 来源信息

项目	内容
发布者	宝玉 xp（前微软 Asp.Net MVP，2025 微博年度新知博主）
观看量	3.4 万次
发布时间	发布于美国
翻译	Jesse Lau 遁一子

1.2 主要议题

Anthropic 研究团队用 Claude Mythos Preview 做安全研究，发现了这些：

“在 OpenBSD 上，我们发现了一个存在了 27 年的漏洞——我只需向任意 OpenBSD 服务器发送几段数据就能让它崩溃。”

以及 Linux 上的权限提升：

“在 Linux 上，我们发现了多个漏洞，作为一个没有任何权限的用户，只需在机器上运行一个二进制文件，就能将自己提升为管理员。”

§2 模型能力为什么突然够用了

2.1 Dario Amodei 的主要观点

Anthropic CEO Dario Amodei 指出：

“有一种加速的指数级增长，而在这条指数曲线上，存在着一些意义重大的节点。Claude Mythos Preview 就是其中一个特别大的跃升。”

Dario Amodei 的判断：

观点	说明
编程训练的外溢	没有专门训练它做网络安全，训练的是编程，但编程能力到了一定程度，安全漏洞识别自然跟上来
和专业人类水平相当	识别漏洞方面已经不输专业安全研究员
防御端先受益	能更早发现更多漏洞并修复，攻防天平往防御倾斜

2.2 三个能力叠在一起

Claude Mythos Preview 在安全研究上表现突出，靠的是三件事叠在一起：编程能力（代码理解→安全漏洞识别）、自主性（独立调查→漏洞链构建）、长周期任务执行（持续分析→深度挖掘）。Anthropic 没有专门训练它做网络安全，编程能力到了这个量级，安全研究自然跟上来。

§3 漏洞链构建：从单点到串联

3.1 Nicholas Carlini 的发现

Anthropic 研究员 Nicholas Carlini 指出：

“它具备将多个漏洞串联起来的能力，也就是说，你发现了两个漏洞，单独看都不算什么，但这个模型能够利用三、四个甚至五个漏洞组合出攻击链，按顺序执行后达成某种非常复杂的最终效果。”

漏洞链构建示意图：

┌─────────────────────────────────────────────────────────────┐
│              AI驱动的漏洞链构建                                │
├─────────────────────────────────────────────────────────────┤
│                                                              │
│  漏洞A ──┐                                                   │
│          ├──→ 漏洞B ──┐                                    │
│  漏洞C ──┘             ├──→ 攻击链 ──→ 完整漏洞利用        │
│  漏洞D ───────────────┘                                                │
│                                                              │
│  传统方法：单独发现漏洞A、B、C，各自为战                       │
│  Claude Mythos：自动识别关联性，构建攻击路径                   │
│                                                              │
└─────────────────────────────────────────────────────────────┘

3.2 自主性让漏洞链成为可能

Anthropic 研究员的解释：

“我们认为这个模型之所以能做得这么好，是因为它非常自主，它在执行长周期任务方面整体更强，类似于一个人类安全研究员一整天所做的那种工作。”

传统安全测试	Claude Mythos 辅助
人工渗透测试	AI 初步扫描
逐个漏洞分析	自动关联分析
手工构建攻击链	AI 自动构建
有限时间窗口	持续深度扫描

§4 实测结果

4.1 OpenBSD：27 年历史的漏洞

Nicholas Carlini 的发现：

“在 OpenBSD 上，我们发现了一个存在了 27 年的漏洞——我只需向任意 OpenBSD 服务器发送几段数据就能让它崩溃。”

漏洞特征：

属性	描述
存在时间	27 年
影响范围	任意 OpenBSD 服务器
利用方式	发送特定数据即可触发崩溃
修复状态	已通知并修复

4.2 Linux：权限提升漏洞

“在 Linux 上，我们发现了多个漏洞，作为一个没有任何权限的用户，只需在机器上运行一个二进制文件，就能将自己提升为管理员。”

权限提升类型：

// 典型的本地权限提升漏洞模式

// 用户空间 → 内核空间
漏洞类型1: 任意内核内存写入
漏洞类型2: 提权到root
漏洞类型3: 容器逃逸

// 利用条件：
// - 无需预先权限
// - 只需执行一个二进制文件
// - 影响主流Linux发行版

4.3 扫描范围与成果

平台	发现	状态
OpenBSD	27 年历史漏洞	已修复
Linux	多个权限提升漏洞	已修复
主要操作系统	大量漏洞	分批通知中

Nicholas Carlini 的总结：

“在我过去几周发现的漏洞，比我这一辈子之前发现的加起来还多。”

§5 玻璃翼计划：不公开发模型，那怎么办

5.1 为什么不能公开

Anthropic 研究员的解释：

“显然，这样的模型如果落入不当之手，其能力可能造成危害，因此我们不会大范围发布这个模型。”

公开的风险：

风险类型	潜在威胁
漏洞武器化	恶意行为者可利用发现
0day 交易	漏洞可能在地下市场出售
国家级 APT	定向网络攻击能力
勒索软件	自动化漏洞利用

5.2 玻璃翼计划架构

Dario Amodei 的阐述：

“更强大的模型将会从我们和其他机构中不断涌现，所以我们确实需要一个应对计划。”

┌─────────────────────────────────────────────────────────────┐
│              玻璃翼计划 (Project Glasswing) 架构                │
├─────────────────────────────────────────────────────────────┤
│                                                              │
│                    ┌─────────────────┐                       │
│                    │  Claude Mythos  │                       │
│                    │  Preview Model  │                       │
│                    └────────┬────────┘                       │
│                             │                               │
│                    ┌────────┴────────┐                       │
│                    │  受信任合作伙伴  │                       │
│                    │  (白帽优先获取)  │                       │
│                    └────────┬────────┘                       │
│                             │                               │
│     ┌───────────────────────┼───────────────────────┐        │
│     │                       │                       │        │
│     ↓                       ↓                       ↓        │
│ ┌────────┐           ┌────────┐           ┌────────┐    │
│ │ OpenSSF │           │  操作系统  │           │  云服务商 │    │
│ │ 基金会  │           │  维护者    │           │          │    │
│ └────┬───┘           └────┬───┘           └────┬───┘    │
│      │                    │                    │         │
│      └────────────────────┴────────────────────┘         │
│                           │                                │
│                           ↓                                │
│                 ┌─────────────────┐                       │
│                 │   协调防御行动   │                       │
│                 │  发现 → 修复 → 部署 │                       │
│                 └─────────────────┘                       │
│                                                              │
└─────────────────────────────────────────────────────────────┘

5.3 合作伙伴的视角

OpenSSF（Open Source Security Foundation）代表的观点：

“通过让这些软件开发者率先获得先进工具，这为我们所有人赢得了集体性的先发优势，它让我们能够发现以前发现不了的问题，并帮助我们更快地修复这些问题。”

§6 安全研究正在变成什么样

6.1 人力 vs AI

维度	传统方法	AI 辅助方法
覆盖范围	有限代码审计	全量代码扫描
发现速度	数周/数月	数小时/数天
漏洞关联	人工关联	AI 自动串联
持续性	项目周期	持续监控
规模化	专家稀缺	可扩展

6.2 AI 辅助安全研究的实际流程

流程已经跑通：模型对目标代码库做大规模扫描，找出潜在漏洞；自动关联分析，把多个漏洞串成攻击链；通过负责任披露流程通知维护者、等待修复、协调发布。高危漏洞优先通知、加速修复；常规漏洞走标准披露流程。

6.3 网络安全就是社会安全

Anthropic 研究员的总结：

“我们生活中的一切现在都依赖于软件。软件吞噬了世界，我们生活中的每一个模拟层面，都以某种方式映射到了数字领域。”

一句话收束：

“网络安全就是社会的安全。”

§7 合作与治理

7.1 政府合作

Dario Amodei 的表态：

“我们已与美国政府多个部门的官员进行了沟通，并表示愿意与他们合作，共同评估这些模型的风险，并帮助防御这些风险。”

7.2 行业协作

“各行各业携手合作，共同构建更强大的防御能力，这至关重要，没有一个组织能看到全貌并独自应对这一切。”

7.3 时间维度

“这不是几周的项目就能完成的事，这将是几个月、甚至可能几年的工作。”

要达到的状态：

目标状态：
├── 世界的软件比以前更安全
├── 客户数据得到更好保护
├── 金融交易基础设施更安全
└── 关键基础设施防御能力提升

§8 争议与悬而未决的问题

8.1 视频评论区的分歧

观点类型	代表性评论
安全担忧	“越来越有《疑犯追踪》的感觉了”
开放性质疑	“不开放，没法蒸馏了怎么办”
地缘政治	“世界要分裂了，以安全之名”
技术乐观	“正向增益正在放大，AGI 指日可待”
实践问题	“漏洞什么都没说，是真是假谁知道”

8.2 几个悬而未决的问题

围绕安全研究，有几个问题还没有答案：

透明度——漏洞细节公开到什么程度？何时发布技术细节？社区响应机制怎么建？

访问控制——“有限发布"的边界在哪？合作伙伴怎么筛选？退出机制有没有？

能力不对称——白帽和黑帽的 AI 能力差距会怎么演变？小型组织怎么获得防护？全球安全格局会不会因此加速分化？

§9 收束

9.1 四个发现

发现	影响
27 年 OpenBSD 漏洞	潜伏数十年的漏洞也能被揪出来
Linux 权限提升	从普通用户到 root 的自动化路径
漏洞链构建	多个低危漏洞串成高危攻击链
玻璃翼计划	不公开发模型，走白帽优先披露

9.2 要点

“我们生活中的一切现在都依赖于软件。软件吞噬了世界。网络安全就是社会的安全。”

9.3 Anthropic 的目标

“但我希望最终我们能达到这样一个状态：世界的软件，客户数据，金融交易和关键基础设施，都比以前更加安全。”

§10 常见误区

「AI 挖漏洞 = 黑客更危险」——片面。Glasswing 的设计恰恰是让防御方先拿到能力（白帽优先披露），Dario 的判断是攻防天平往防御倾斜；真正危险的是能力不受控地扩散，而不是能力本身。
「不公开模型就是不透明」——不完全对。不公开的是模型权重（怕被武器化），而漏洞与修复走的是负责任披露流程，技术细节会分批公开给社区。
「27 年老漏洞被挖出，说明开源不安全」——恰恰相反。老漏洞一直都在，只是以前没有工具能系统性排查；能被批量揪出并修复，是开源可审计性的胜利。

§11 自测清单

说得清为什么「没专门训练网络安全，但编程能力够强，安全能力就外溢上来」？
讲得出「漏洞链构建」和单点漏洞发现的本质区别？
说得出玻璃翼计划「不公开发模型、给白帽优先」背后的风险权衡？
列得出这次披露的三类实测发现（OpenBSD 27 年漏洞 / Linux 提权 / 漏洞链）？

§12 参考资料

想核实本文的一手来源，下一步可以直接看 Anthropic 官方与权威报道：

Anthropic — Project Glasswing：官方计划页（Claude Mythos Preview + 合作伙伴 + 白帽优先披露）
The Hacker News — Anthropic’s Claude Mythos Finds Thousands of Zero-Day Flaws：第三方报道
源视频：宝玉 xp 搬运翻译的 Anthropic 官方安全研究视频（翻译：Jesse Lau 遚一子；核心参与：Dario Amodei、Nicholas Carlini）

说明：本文基于宝玉 xp 搬运翻译的 Anthropic 官方视频做结构化精读；Project Glasswing 与 Claude Mythos Preview 均为 Anthropic 2026-04 公开发布的真实计划与前沿模型，引文为视频字幕转述。

视频信息：

发布者：宝玉 xp
翻译：Jesse Lau 遁一子
核心参与：Dario Amodei, Nicholas Carlini, Anthropic 研究团队

🦞 文档版本：v1.0 | 写作日期：2026-04-09

更新于 2026-07-21

Anthropic, Claude, 安全研究, 漏洞发现, Glasswing, AI安全, Dario Amodei

返回 | 主页

下一步

如果这篇内容对你有帮助，继续往更完整的路径里走。

你可以从专题页继续系统阅读，也可以通过联系页反馈想跟进的主题、工具和合作方向。

AI Agent 专题 Coding Agent 专题开源 AI 工具联系

目录