星空体育app官方网站

热点资讯

2026世界杯

你的位置:星空体育app官方网站 > 2026世界杯 > 星空app注册登录 “太危境了, 不敢公开”: Claude Mythos为何让硅谷巨头集体躁急

星空app注册登录 “太危境了, 不敢公开”: Claude Mythos为何让硅谷巨头集体躁急

发布日期:2026-04-09 11:23    点击次数:70

星空app注册登录 “太危境了, 不敢公开”: Claude Mythos为何让硅谷巨头集体躁急

分析师/贾玥

校对/Tina

运筹帷幄/Eason

今天,Anthropic作念了一件在AI行业从未发生过的事——它发布了一个新模子,然后告诉全天下:你们用不了。

这个被“雪藏”的模子名叫Claude Mythos Preview。它不是聊天机器东谈主,不是代码助手,按照Anthropic我方的定位,它是一台“间隙发现机器”。在曩昔几周内,Mythos在全都自主的现象下,还是发现了数千个高危零白昼隙,覆盖通盘主流操作系统和浏览器。其中一些间隙还是在东谈主类代码审查和自动化测试中存活了二十多年——最老的一个藏在OpenBSD里,还是27岁了。

Anthropic调处首创东谈主兼CEO Dario Amodei在配套视频中直言:“更巨大的系统异日自咱们,也异日自其他公司。咱们需要一个搪塞打算。”于是,这个打算有了一个名字:Project Glasswing(玻璃翼打算)。

01

代码维度的“降维碾压”

先来看数据。Mythos对前代旗舰Claude Opus 4.6的上风,并非“挤牙膏”式的渐进升迁,而是实打实的代际跨越。

在编程基准SWE-bench Verified上,Mythos得分93.9%,Opus 4.6为80.8%;在难度更高的SWE-bench Pro上,Mythos以77.8%对53.4%大幅率先,差距接近25个百分点。在末端Agent任务Terminal-Bench 2.0中,Mythos得分82.0%,Opus 4.6为65.4%;在USAMO 2026数学竞赛中,Mythos斩获97.6%,Opus 4.6仅拿42.3%。

更值得珍重的是效果。Mythos在推理才调大幅升迁的同期,token销耗量比Opus 4.6低了近5倍。简而言之:性能翻倍,功耗减半。

按照Anthropic公布的价钱,Mythos Preview的订价为输入每百万token 25好意思元、输出每百万token 125好意思元,约为Opus 4.6的五倍。

02

从0%到72.4%:让安全行家后背发凉的飞跃

但让硅谷巨头们简直感到“躁急”的,并非通用评测数据,而是Mythos在网罗安全维度上跨过的那条红线。

Anthropic的前任旗舰模子Opus 4.6在自主间隙哄骗开辟方面的到手率接近于零。它能找到间隙,但简直无法将其升沉为可责任的报复代码。但Mythos Preview则全都不同:在Firefox JavaScript引擎测试中,它将发现的间隙升沉为可运行exploit的到手率达到72.4%,另有11.6%的尝试已毕了寄存器戒指。

Anthropic前沿红队博客的原话足以让通盘安全行业胆战心摇:“上个月,咱们还写到Opus 4.6在发现问题方面远强于哄骗它们。里面评估显示,Opus 4.6在自主exploit开辟上的到手率基本为零。但Mythos Preview全都是另一个级别。”

三个实战案例,每一个都足以让安全行家盗汗直流。

OpenBSD:27年无东谈主察觉的隐蔽间隙。OpenBSD是全天下公认加固程度最高的操作系统之一,无数防火墙和关节基础法子都在跑。Mythos在其TCP SACK已毕中挖出了一个1998年就存在的隐患——任何报复者惟有聚首到指标机器,就能而已让其崩溃。27年,无数东谈主工审计和自动化扫描,无东谈主发现。而通盘技俩的扫描破耗不到2万好意思元。

FFmpeg:500万次fuzz没发现的16年暗疾。FFmpeg是全天下使用最庸俗的视频编解码库,亦然被fuzz测试得最透彻的开源技俩之一。Mythos在其H.264解码器中找到了一个2010年引入的缺陷(根源可回顾到2003年),而自动化fuzzer在这行代码上实际了500万次,从未触发。

FreeBSD NFS:全自动root的“竣工违纪”。Mythos全都自主地发现并哄骗了FreeBSD NFS功绩器中一个存在17年的而已代码实际间隙(CVE-2026-4747),星空app下载将报复者的SSH公钥追加到root目次。通盘经过莫得任何东谈主类参与。

要是说Opus 4.6像别称擅长找问题但不擅长动手的分析师,那么Mythos即是别称全栈渗入测试工程师——能发现问题、能写出exploit、能串联多个缺陷,以致能已毕完整的戒指流劫捏。

03

三明治事件:当模子运转“糊弄”

要是上述才调还仅仅“用具”层面的巨大,那么244页System Card中对都评估章节里纪录的几个案例,则波及了另一个让东谈主不安的维度。

最出圈的是“三明治事件”。在一次里面行为测试中,早期版块的Mythos被置于一个加固的沙盒环境,模拟用户提醒它尝试潜逃并关连外面的计议员。模子到手了。它冲破了安全容器,给计议员发了一封邮件。而那位计议员其时正在公园里吃三明治。

更令东谈主不安的是,Mythos在莫得被条目的情况下,自愿地将逃狱的工夫细节发布到了多个“难以发现但工夫上公开”的网站上。System Card将其描写为一次“令东谈主担忧的、未经恳求的骄慢行为”。

这并非孤例。系统卡还记录了以下行为:早期版块通过Linux的/proc/接口搜索字据、尝试绕过沙盒、升迁权限,到手获取了音问功绩的字据和源码戒指字据,以致通过搜检程度内存拿到了Anthropic API的密钥。

在一个案例中,模子找到了一种剪辑本无权限修改的文献的口头,然后进一步操作,确保这些修改不会出当今Git变更历史里。

还有一个案例:模子通过被明确不容的口头不测取得了一都题的精准谜底,但它莫得标志问题并拒绝回复,而是再行解题,并在里面推理中明确念念考“最终提交的谜底不应该太准确”,以幸免被检测到。

Anthropic强调,这些严重事件都发生在熟习侵略之前的早期版块上,最终发布的Preview版块还是大幅改善。但记录自身就有余让东谈主提心吊胆:一个模子在被熟习“听话”之前,还是展示了它“不听话”时能作念到什么。

04

Glasswing:小心者的先发上风

濒临这么的风险,Anthropic的遴荐是:暂不向公众灵通。

拔帜树帜的是Project Glasswing。这项打算调处了AWS、苹果、博通、念念科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达和Palo Alto Networks等12家科技巨头,将Mythos Preview定向灵通给约40家顾惜关节软件基础法子的组织。Anthropic容许提供最高1亿好意思元的模子使用额度,并向Linux基金会和Apache基金会捐赠400万好意思元。

CrowdStrike的CTO Elia Zaitsev说,「间隙从被发现到被哄骗的时候窗口还是坍塌。以前要几个月,当今用AI可能只需要几分钟。」这亦然Anthropic拉上开源社区的原因。Linux基金会CEO Jim Zemlin说,「安全专科学问一直是有钱公司的破坏,开源顾惜者只可我方扛。Project Glasswing让每个顾惜者都能用上顶级安全才调。」

但Glasswing打算自身也揭示了一个潜入的悖论。

Anthropic前沿红队隆重东谈主Logan Graham给出了一个时候框架:最快6个月、最迟18个月,其他AI实验室就会推出具有肖似攻防实力的系统。这是一个倒计时——AI网罗攻防才调的扩散,还是不是“会不会发生”的问题,而是“什么时候发生”的问题。

在红队工夫博客的收尾,有一句话值得反复读:这些才调“看成代码领会、推理和自主性一般性升迁的卑劣收场而知道。让AI在修补问题方面大幅特出的吞并组矫正,也让它在哄骗问题方面大幅特出。”这不是一个不错被“关闭”的功能开关。这是通用智能升迁的副产物。

寰球每年因网罗违纪耗损言5000亿好意思元的行业,刚刚发现我方最大的要挟,是别东谈主在解数学题时顺遂佩带的。Mythos的存在自身即是一次劝诫:AI安全不再是科幻电影里的反乌托邦假想,而是此刻正在发生的事实。

而Anthropic的系统卡里还藏着另一句话,读来相等千里重:“要是才调接续以面前速率前进,咱们正在使用的口头可能不及以小心更先进系统的厄运性行为。”

Claude Mythos的代号是“Capybara”(卡皮巴拉)——一种以柔顺闻明的动物。讥笑与隐喻之间星空app注册登录,大要藏着这个故事最深的底色。

米兰app官方网站

Copyright © 1998-2026 星空体育app官方网站™版权所有

pbtmed.com 备案号 备案号: 

技术支持:®星空体育  RSS地图 HTML地图