Anthropic最强模型Claude Mythos意外泄露:3000份内部文件藏不住了

科技1个月前发布 leso
28 0 0

Anthropic的下一张王牌,还没亮就先漏了底。

3月26日,因内容管理系统人为配置错误,Anthropic约3000份未公开内部资料短暂可被公开搜索访问,其中包含了一个此前从未对外披露的模型——代号”Capybara”,对外名称为Claude Mythos。泄露文件显示,这款模型在软件编程、学术推理、网络安全等多项基准测试中”大幅超越”现有旗舰Claude Opus 4.6,尤其是网络安全能力被标注为”远超所有现有AI模型”,连Anthropic内部文件都专门附上了安全风险警告。《财富》杂志将此事告知Anthropic后,公司已迅速限制了相关内容的公开访问。

目前Claude Mythos因运行成本极高,仅向少数早期客户开放有限测试,尚未准备好公开发布。泄露材料中还提到Anthropic计划举办一场仅限受邀CEO出席的峰会,让欧洲企业领袖提前体验未发布AI能力。此次泄露由LayerX Security的研究人员和剑桥大学研究员联合发现,整个事件把一家最强调AI安全的公司,因自己的配置失误推到了舆论风口。

一边喊着AI安全最重要,一边3000份内部文件悄悄对外开放——Anthropic这次的公关危机,比模型本身更值得好好复盘一下。

© 版权声明

相关文章

暂无评论

none
暂无评论...