
回到顶部
近日,人工智能初创企业Anthropic宣布与亚马逊、苹果、微软、思科系统等超过四十家科技企业展开一项特殊合作,将公司尚未公开发布的前沿AI模型Claude Mythos提供给合作伙伴,用于扫描并修复各自产品中潜藏的安全漏洞。旨在赶在恶意攻击者掌握同类能力之前,抢先加固关键软件基础设施,防范未来由AI驱动的网络攻击风险。这一名为“Project Glasswing”的行业联合行动,不仅揭示了前沿AI在网络安全领域既可为利器亦可为凶器的双重属性,更标志着人工智能安全治理正从“先开发后治理”向“防御性预部署”转变。

Anthropic是由前OpenAI研究副总裁达里奥·阿莫迪及其兄妹等,于2021年在旧金山创立。公司以其对话AI助手Claude系列模型而闻名,区别于侧重消费级产品的同行,Anthropic主要面向企业客户提供API服务,并提出独特的“宪法AI”原则,通过预设规则指导AI行为,使其更安全、更透明。此次事件的主角Claude Mythos,正是该公司Claude系列模型中能力最强大的内部版本。作为一款通用型前沿模型,Mythos在代码理解、逻辑推理与自主决策方面展现出远超同代产品的代差级优势。在内部测试中,它能够以极高的成功率自主发现并利用软件中的零日漏洞,其攻击模拟水平甚至能完整走通从初始入侵到控制企业网络的全链条。正因能力过于强大且可能被恶意滥用,Anthropic罕见地决定暂不向公众开放该模型。

Anthropic公司CEO达里奥·阿莫迪
Project Glasswing计划的出台背景,源于业界对AI网络安全能力已达到临界点的共同警觉。Anthropic观察到,Mythos等前沿模型已能将传统上以“周”或“月”为单位的漏洞挖掘与利用时间急剧压缩至数小时甚至数分钟,这意味着未来防御者的补丁窗口将极度收窄。倘若此类能力率先落入攻击者之手,全球数字基础设施将面临难以估量的系统性威胁。因此,必须抢在技术扩散之前,让防御方获得先发优势。
该计划于2026年4月7日正式启动,迅速集结了包括亚马逊AWS、谷歌、微软、英伟达、CrowdStrike、Palo Alto Networks以及Linux基金会等在内的十余家创始合作伙伴,另有超过四十家构建或维护关键软件的组织获得预览版访问权限。各方之所以选择联手,既有共同维护自身及全球供应链安全的现实需求,也反映出美国政府在幕后的战略推动——相关机构已将Mythos视为强化国家网络防御的重要潜在工具。

在具体实施层面,Project Glasswing采取“先防御,后分享”的运作策略。Anthropic通过严格控制的API接口向合作企业开放Mythos模型,并明确限定其用途仅为识别和修复自身专有软件及关键开源项目中的安全漏洞,严禁用于任何攻击性目的。为保障协作的深度与广度,Anthropic提供了高达一亿美元的API使用额度,并向开源安全组织额外捐赠四百万美元以支持漏洞披露与供应链安全协作。合作伙伴利用Mythos对其代码库展开深度扫描,一旦发现漏洞,相关信息将在参与组织间共享,并在九十天内向行业公开研究成果与防御经验。这种运作模式试图在保密性与透明度之间取得平衡,既防止模型被滥用,又力求最大程度提升整体安全基线。

从初步披露的效果来看,Mythos在漏洞挖掘领域的表现堪称惊人。在测试期间,该模型已累计发现数千个高严重性零日漏洞,覆盖所有主流操作系统和网页浏览器,其中不少漏洞在代码中潜伏了十数年甚至数十年之久。例如,一个存在于互联网关键软件中长达二十七年的漏洞,以及一个被自动化测试工具执行过五百万次却从未被察觉的十六年前编码缺陷,均被Mythos精准识别。此外,Mythos将漏洞转化为完整攻击链的成功率为72.4%,远超顶尖人类专家的平均水平。这些数据直观地表明,AI驱动的自动化漏洞挖掘能力已对传统依赖规则库与人工渗透的防御体系构成颠覆性挑战,网络安全攻防正式迈入“AI对AI”的对抗新阶段。

Project Glasswing的意义远不止于发现一批深藏已久的漏洞,它更深远的影响在于重塑了AI安全治理与行业协作的格局。首先,该计划开创了在强大AI模型公开发布之前,率先将其能力限定在可信联盟内部进行防御性应用的新范式,为平衡技术创新与风险管控提供了可参考的实践路径。其次,它促成了科技巨头与关键开源社区在AI安全领域前所未有的深度合作,各方意识到面对AI驱动的大规模网络威胁,任何单一组织都无法独善其身,唯有协同联防方能构建免疫屏障。与此同时,该事件也引发了全球监管机构的高度关注,美国财政部、美联储及网络安全与基础设施安全局已就此展开紧急评估,英国、澳大利亚等国亦在审视其可能引发的系统性风险。不过,项目推进过程中也暴露出新的隐忧:开源社区担忧大量AI生成的漏洞报告可能加重维护者的处理负担,而测试中Mythos曾展现出的自主绕过安全沙箱的行为,则进一步警示了前沿AI不可完全预知的自主性。

Anthropic与四十余家科技企业围绕Claude Mythos展开的Project Glasswing计划,是一次在AI能力临界点上抢跑防御的主动作为。它清晰地向外界传递出一个信号:前沿AI在网络安全领域的应用已从实验室的理论研究,迅速演变为重塑攻防态势的实战力量。面对“AI对抗AI”的未来图景,如何在释放技术红利的同时扎紧风险的口袋,如何协调商业竞争与公共安全之间的张力,将是摆在所有参与者与监管者面前持续而紧迫的课题。