Anthropic搓出了史上最强AI模型，但不敢发布……

分类：快讯 | 时间：2026-04-08 12:09 | 关注

　　原创 Odaily 星球日报

　　作者｜Azuma

　　 4 月 8 日，Claude 背后的 AI 开发公司 Anthropic 官方宣布将推出一项名为“玻璃之翼”的新计划，该计划将与亚马逊、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金会、微软、英伟达和 Palo Alto Networks 等多家头部大厂联合推进。

　　 Anthropic 表示，这是一项旨在保护全球最关键软件的紧急举措，各方将共同使用 Mythos Preview 版本来发现并修复当前世界赖以生存的系统中的潜在缺陷。

　　所谓 Mythos，即 Anthropic 正在开发的下一代 AI 模型，这是人类历史上第一个总参数突破十万亿量级的模型，训练成本达到了惊人的 100 亿美元。相较于 Claude 当前最强大的模型 Opus 4.6，Mythos 在软件编码、学术推理和网络安全等测试中得分均大幅提高。

　　关于 Mythos 的传言上周便已在市场流传，当时市场的普遍担忧是 —— 拥有网络安全特化能力的 Mythos 是否会影响当前的安全攻防格局？如若被恶意利用，是否会造成更大规模的安全事故？Odaily 当时亦曾报道此事，并曾与业界安全专家、慢雾创始人余弦探讨对加密货币行业安全攻防的潜在影响，但当时 Anthropic 方面并未公开承认 Mythos 的存在，因此相关信息仍然有限。

　　 4 月 8 日，随着“玻璃之翼”计划的公布，Anthropic 也披露了更多 Mythos 的相关细节。基于 Anthropic 方面公布的实测案例来看，Anthropic 对于 Mythos 的能力并未夸大，以至于该公司甚至不敢直接公开发布该模型，以防被黑客群体恶意利用，而是计划先通过“玻璃之翼”计划让头部大厂试用排查，提前修补潜在漏洞。

　　 Mythos 秀肌肉：几周时间，挖出数千个“零日漏洞” 在谈及 Mythos 的实力时，Anthropic 直言表示，该模型的诞生意味着一个严峻的事实已经到来 —— AI 模型的编码能力已经达到了极高的水平，在发现和利用软件漏洞方面，它们几乎可以超越除了最熟练的人类之外的所有人。

　　根据 Anthropic 方面的披露，在短短几周时间内，Anthropic 使用 Mythos 识别出了数千个零日漏洞，其中许多属于高危漏洞，问题覆盖了所有主流操作系统和主流浏览器，并波及一系列其他关键软件。

　　 Anthropic 给出了几个颇具代表性的案例：

　　 Mythos 发现了 OpenBSD 中一个存在 27 年的漏洞，该系统一直以“极度安全”著称，被广泛用于防火墙等关键基础设施，而这一漏洞允许攻击者远程直接使系统崩溃；在被大量软件使用的视频处理库 FFmpeg 中，Mythos 找到了一个存在 16 年的漏洞，该问题所在代码曾被自动化测试触发超过 500 万次，但始终未被发现； Mythos 还能够将 Linux 内核中的多个漏洞自动串联，从普通用户权限升级至完全控制服务器。更令人担忧的是，Anthropic 表示这些漏洞大多是 Mythos 在几乎无人干预的情况下“自主发现并构造利用路径”的，这或许意味着 AI 已经开始具备类似顶级黑客团队的自动化攻防能力。

　　在评测基准上，Mythos 较 Opus 4.6 也呈现出了断层级的进化。例如在网络安全漏洞复现测试中，Mythos 达到 83.1%，而 Opus 4.6 则为 66.6%；在多项编码与推理测试中，Mythos 的得分同样实现大幅领先。

　　或许正是因为 Mythos 的能力过于强大，Anthropic 并没有选择直接开放模型，而是先推出了“玻璃之翼”计划，让整个互联网提前“加固”。

　　通过该计划，Anthropic 将向计划参与方提前开放 Mythos Preview 版本，用于发现并修复其基础系统中的漏洞或弱点——重点聚焦于本地漏洞检测、二进制程序黑盒测试、终端安全加固以及系统渗透测试等任务。

　　 Anthropic 还承诺，将向计划参与方提供总计 1 亿美元的模型使用额度，以支持整个研究预览阶段的使用。此后，Mythos Preview 版本将以每百万输入 / 输出 tokens 分别 25 美元 / 125 美元的价格向参与方开放。除去模型使用额度外，Anthropic 还会通过 Linux 基金会向 Alpha-Omega 和 OpenSSF 捐赠 250 万美元，并向 Apache 软件基金会捐赠 150 万美元，以帮助开源软件维护者应对不断变化的安全环境。

　　 Anthropic 计划逐步扩大“玻璃之翼”的参与范围，并持续推进数月，同时尽可能分享经验，以便其他组织能够将相关经验应用于自身安全建设。90 天内，Anthropic 将公开报告阶段性成果，包括已修复的漏洞以及可披露的安全改进措施。

　　技术只会不断升级，但也无需太过忧心 AI 正在不可逆地改变我们所熟悉的这个世界，包括本文所聚焦的网络安全领域。随着漏洞被发现与利用的门槛大幅降低，人们不免会产生担忧，AI 是否会成为恶意行为者手中的利刃，威胁现有的网络安全平衡？

　　针对这一问题，Anthropic 认为“我们仍有理由保持乐观”，AI 模型之所以危险，正是因为它们具备在不法分子手中造成危害的能力，但于此同时，AI 在发现和修复重要软件缺陷以及开发更安全的新软件方面也具有着不可估量的价值。

　　可以预见的是，未来几年 AI 的能力仍将快速进化，但在新的攻击手段出现之时，新的防御机制也会同步涌现。技术升级不可避免，但这并不意味着风险必然失控 —— 只要防御体系同步进化，甚至能够借助 AI 建立更高强度的安全护城河。

温馨提示：内容仅供参考