Anthropic最强模型Claude Mythos意外泄露：3000份内部文件藏不住了

Anthropic的下一张王牌，还没亮就先漏了底。

3月26日，因内容管理系统人为配置错误，Anthropic约3000份未公开内部资料短暂可被公开搜索访问，其中包含了一个此前从未对外披露的模型——代号”Capybara”，对外名称为Claude Mythos。泄露文件显示，这款模型在软件编程、学术推理、网络安全等多项基准测试中”大幅超越”现有旗舰Claude Opus 4.6，尤其是网络安全能力被标注为”远超所有现有AI模型”，连Anthropic内部文件都专门附上了安全风险警告。《财富》杂志将此事告知Anthropic后，公司已迅速限制了相关内容的公开访问。

目前Claude Mythos因运行成本极高，仅向少数早期客户开放有限测试，尚未准备好公开发布。泄露材料中还提到Anthropic计划举办一场仅限受邀CEO出席的峰会，让欧洲企业领袖提前体验未发布AI能力。此次泄露由LayerX Security的研究人员和剑桥大学研究员联合发现，整个事件把一家最强调AI安全的公司，因自己的配置失误推到了舆论风口。

一边喊着AI安全最重要，一边3000份内部文件悄悄对外开放——Anthropic这次的公关危机，比模型本身更值得好好复盘一下。