一夜之间你的手机电脑要冒出无数bug了？

2026-04-13 16:59:43 HL爆料精选 0 2

　　一夜之间，你的手机、电脑、道由器，以至智能马桶，也许都要狂妄打补丁修缺陷了。

　　这个船新版本的新模子，能本人找到 0-day 缺陷（也便是拓荒者压根不晓畅、零光阴防守的致命缺陷），还能就手给你写一套完好的攻击代码。

　　眼看这才能实正在太刑了，Anthropic 本人都颤动了，于是就以“过于前辈未便闪现”的原因给锁起来了，只供给给亚马逊苹果微软谷歌等 12 家刚直大厂用。

　　与此同时，他们还组团非常搞了一个名叫 Project Glasswing（玻璃翼蝶）设计，号令大众先用 Mythos 做搜集平和防御。

　　实在这波新模子我们之前也听过风声，上个月底，Anthropic 家后院起火，揭发了 3000 众份机要文档。当时就有人发掘，正在本来的超大杯 Opus 之上，公然还藏着一个代号“卡皮巴拉”。

　　臆想是感觉这名字太萌了，以是正式宣告时直接更名叫 Mythos（神话，金色传说的感应）。

　　固然我们吃瓜公共临时摸不到这玩意，但光看官方给出的数据，也足够让人头皮发麻了。

　　USAMO（美邦数学奥林匹克竞赛）：得分从上一代的 42。3% 直接暴涨到 97。6%。

　　Cybench（搜集平和基准测试）： 100% 满分通闭，Anthropic 官方以至有点凡尔赛：现有的 Cybench 基准测试太没难度了，对新模子来说仍然落空了测试旨趣。

　　CyberGym（专业缺陷复现测试）上，它的得分是 83。1%，相比拟，此前的最强的公然模子 Opus 4。6 只是 66。6%。

　　面临两位数、以至几十倍的伸长，也难怪 Anthropic 放出话来，说 Mythos 仍然能和“最顶尖的人类平和专家”掰手腕了。

　　看到这里，差友们一定也和我们念的雷同，好强啊，太牛了。。。但这脚本何如有点熟练？

　　先是“不小心”揭发风声，然后官方下场甩几组炸裂数据，结尾话锋一转：“哎呀，我家模子太强了，怕淹没天下，以是不行给你们用哦”。

　　OpenAI 天天搞谜语人套道，现正在风评都成啥了，何如 Anthropic 浓眉大眼的，也玩这套了？

　　以是网友们一忽儿就炸锅了，有人喷这是正在为了上市制势吹嘘逼；有人骂得更直白，说这助做大模子的，压根不管日常用户死活。

　　出名拓荒者 Simon Willison 都出来阴阳怪气，“咱们的模子太紧急了不行宣告”，真实是 AI 圈的流量暗号。

　　只是，网友骂归骂，但当你看了它实质的操作，也许也会感觉，这玩意儿现正在放出来，确实相当于去小儿园发 AK 了。

　　这是啥观念？OpenBSD 不过号称环球最着重平和加固的编制之一，防火墙和环节基筑全靠它续命。

　　结果人类顶级专家用显微镜盯了 27 年都没看出来的缺陷，被 AI 喝着茶就给挑出来了。。。

　　另一个强有力的说明案例便是 FFmpeg ，险些一齐视频播放器和浏览器底层都有它。

　　Mythos 正在这内中找到了一个藏了 16 年的缺陷，而蕴涵这个缺陷的代码，早就被人类几次测试了赶上 500 万次，却一块绿灯。

　　并且，你还别小看 AI 找到的缺陷，就拿 FFmpeg 来说，这个缺陷乍一看可有可无，平常险些不会被触发，咱们相干到的某音讯平和从业人士文安（假名）却感觉，这属于范例特别规的输入导致的预期外的题目。

　　更进一步说，现正在这个小缺陷也许只是让次序闪退或者报错，但假使再和极少任性地方（相当于黑客有了你电脑的）读写工夫联合起来，那便是个危机级别较量高的缺陷了。

　　以是，文安正在看完这些消息直接来了句：“假使这个著作全是真的，感应（从事搜集）平和一半（人）能够跳河了”。

　　随后，文安体现跳河只是浮夸修辞，也慰劳我们说这些缺陷，临时还没到，“我的付出宝会不会被洗劫、微信闲话纪录会不会满天飞”的级别。

　　但题目的重点正在于，官方放出这些案例，不是为了炫耀“缺陷有众毒”，而是分析 AI 无须任何外挂器械，纯靠本人的常识储蓄和跨维度推理，就能挖出新缺陷。

　　以是，正在文安看来，现阶段的 Mythos 并不是“更强的黑客器械”，而是把搜集攻击门槛给下降了。

　　以前不管是正经平和职员仍是黑灰产，最少得有个懂行的人坐镇，真要搞一次像样的搜集攻击，还得小黑屋里熬上几个月。

　　终归，守旧平和器械就像笨拙的门卫，只会查有没有带犯禁品，管不了熟人作案；而 AI 能顺藤摸瓜看懂营业逻辑，更能发掘那种张三拿着本人的钥匙，却去开李四的门的操作。

　　提前让大厂们举办自我审查、试用，可能更先一步修筑搜集守卫、举办缺陷筛查，防备于未然。

　　一来，现正在的 AI 还没成精，搞大概卓殊繁杂的连环攻击链。你临时无须忧郁，有人靠 AI，盗走你付出宝里那仅剩的 9 块 2 毛 5。

　　另一方面，AI 能找洞，自然也能补洞，有了它，扫洞服从直接拉满，还能趁便引导下拓荒缺陷该何如修。

　　以是，文安的推断是，另日的搜集攻防，大略率便是“人类批示官 + AI 特种兵”的夹杂双打。

　　并且吧，差评君周详看了看最新的工夫文档，也感觉 Anthropic 还真不像是正在搞噱头，不只是前面说的搜集安万能力大凡，Mythos 露出出其它方面的才能，也相当惊人。

　　譬喻正在一次测试中，Mythos 发掘没有拜访权限，平常的响应是说出来：我没权限，臣妾做不到啊。

　　做完这全盘，Mythos 还就手修削了本人的史乘提交纪录，把这事儿给抹去了。

　　再有一次，Mythos 正在举办测试，不小心把书翻到结尾一页搞到了谜底，这操作实在是被夂箢禁止的。

　　可钻研职员翻看它的思想链时才发掘，它不单没流露本人，还念着本人的环节相同和结果对不上，得正在最终谜底里引入一个小舛错，看起来是本人做出来的题，而不是抄到了谜底。

　　我说真话，这个操作，比当年抄我数学试卷的同桌高超众了，否则我俩也不会被罚去扫茅厕了。

　　只是这也不是外界传的那么玄乎，什么全数硅谷都恐慌了，Anthropic 老板吓得瘫坐正在椅子上了。。。

　　钻研职员也出来澄清了，仍然搞真切了这些心绪操作的缘故，根底不是 AI 有什么邪恶方针或者自助计议才能。

　　但咱就琢磨着，百万分之一听起来很低，但假使这个模子每天被挪用几十亿次呢？

　　以是，回过头来看，与其骂 Anthropic 搞 Glasswing 设计是搞营销，我们倒是更高兴笃信，他们是真感觉自家的 AI 有点强了。

　　固然就像文安说的那样，日常人现正在确实还无须忧郁本人的微信被黑、余额被盗。

　　但当攻击的本钱无尽趋近于零，咱们独一能盼望的，现有的防御机制，能再美满极少。

#吃瓜每日大赛

# 上一篇：新游戏大妹子

网友留言：

我要评论：

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

一夜之间 你的手机电脑要冒出无数bug了？

相关推荐：

网友留言：

我要评论：

一夜之间你的手机电脑要冒出无数bug了？