发布日期:2026-04-13 00:49 点击次数:119


Mythos 让大众懦弱了好几天,终于有大牛讨厌了。
率先站出来开炮的是杨立昆。杨老诚昨晚指出," Anthropic 的 Mythos 营销戏是自我烂醉的瞎掰八谈"。
杨立昆在本领不雅点上的老敌手、AI 品评家、大模子怀疑论者、纽约大学熏陶加里 · 马库斯,本日凌晨的措辞稍热诚些:" Mythos 的炒作大部分是传奇迷念念(The Mythos stuff was mostly a myth)……攻破火狐浏览器时,浏览器的沙箱被关闭了。其他功能能被低价的洞开权重模子结束。莫得凭证证明 Mythos 自己是质变飞跃。浮浅讲,大众被耍了"。

杨立昆和马库斯提纲挈领的点破了 AI 大厂给新品营销造势的一种套路,咱们不错称之为"末日狂欢"模式:
率先,AI 大厂文告新品在测度历程中就具备了大则毁天灭地、小则旋乾转坤的才能。
然后, AI 大厂和大雇主们文告各式互助形式在短期内展示本司的安全抑制、发布各式方针文档展示本司经久心系东谈主类的存续与经济福祉。
Mythos 澄澈有此嫌疑。4 月 8 号,Anthropic 用 244 页系统卡文档放风 Mythos 各式可怕,同期文告和全数码行业的大公司互助搞监督与修补 Mythos 的"玻璃翼设计"。
A 厂的知音羽 OpenAI 亦然玩这一招的高东谈主。4 月 7 日,奥特曼示意 GPT6 将翻覆好意思国经济,同期发布 13 页白皮书《智能时期产业政策:以东谈主为先的不雅念》、文告开采" AI 安全测度奖学金"形式。
此形势不是这两天才出现。自从 ChatGPT 不错口吐东谈主言运行,奥特曼、马斯克、阿莫迪们基本每个月都会公开渲染" AI 散失东谈主类"的风险,灭世可能性从一运行的 2% 在三年内高潮到 20%。
从内行到群众,扫数东谈主都运行越来越不吃这套。
按普罗群众的念念路,既然 AI 这样可怕,这几个大雇主别拚命更新产物版块、进步产物质能,东谈主类不就躲过劫难了么。大雇主们一边定时扮演担忧 AI 毁天灭地、一边碰到脑怒 AI 的声息就哭天抢地,AI 会否发精神病相比难说,这几个东谈主可能是真得吃药。
大众真要这样想,那确凿"丞相非在梦中,君乃在梦中耳"。"安全 AI "和东谈主类福祉是种主义,"机构俘获"和口碑营销是种生意。AI 大厂和大雇主们嘴边常挂主义,心里都是生意。
援用一句俏皮话,这等于"刮掉 AI 季世论大东谈主物的画皮,底色是嫌 AI 还不够弘大的加快论者"(Scratch a Doomer hard enough and you will find a Booster inside)。
01
AI 大雇主们说 AI 可能灭世,是教科书示例级的"机构俘获"。简而言之,是黄鼠狼们争取守护鸡舍的岗亭。
拿轨制经济学课件的念念路来解释下:
设定某弥留行业需要监管。
那好,既然此产业弥留到需要被监管,它险些确信也弥散复杂,平淡东谈主无法完全领略,新手管不来。
如斯,需要让对被监管的行业有弥散了解的懂行内行来监管。
那么问题来了,懂行内行无法不是行内成员,不在这个行业里打滚的东谈主懂不了。让行内东谈主监管我方的行业,无法躲避利益纠葛与同行同谋。
终末的截止等于黄鼠狼守护鸡舍。
具体而言,"机构俘获"有丰富的发扬形状。最浮浅也最容易被公众发觉的,是监管机构被从业者附近后,出台无实际抑制力的过于宽松规则,或滥发豁免批准。
或者业界大雇主或特定向上企业不错在诱导、把捏监管机构后,出台琐细苛刻、量身订作念、唯有我方能通过 / 唯有特定竞争敌手无法通过的守密条例。
再如,从业者诬蔑、俘获监管机构后,不错把监管法规设定成严厉到实际无东谈主能合规,达到"红灯作废"效率。淌若交通灯遥远是红灯,抢红灯不仅经济感性,况兼相宜公德。淌若监管法规过苛,莫得实施可能,凯发娱乐(K8)官方网站那业界实况等于大雇主们说了算,公众也无颜责怪他们。

是以奥特曼、阿莫迪他们天天不是说 AI 陨命全东谈主类,等于说 AI 砸你个东谈主的饭碗。这并非 AI 厂大雇主自找报复,拿行话说,这是"叙事占位"(narrative positioning),在全球言论的故意位置占稳了,就不错进行"机构俘获"的政策操作。
拿 OpenAI 的 13 页" AI 新政经济"白皮书来说吧,让机器东谈主缴税给全民发钱、设全球钞票基金、东谈主类责任时制改成上四休三,这些建议不论是在当下的好意思国如故任何国度,都是官方不会也无法通过的。
但 OpenAI 就要提这茬,知道"往常地来讲,我司奋勇解救监管和群众福祉,看咱们的白皮书!"。真要顺着这白皮书的念念路走,单个国度要破钞的现款成本和政事成本是天量,比出台几个监管法规要吓东谈主得多。官方终末是不是就唯有不睬这茬了?
淌若不睬会这白皮书,那某镇要和数据中心抢用电、某市要和数据中心抢用水、某钉子村圮绝为数据中心拆迁让开、某小厂的晶圆订单被 OpenAI 插队,这些琐碎具体的议题,难谈弥留性不错排在畴昔的寰球经济形态之前吗?个东谈主和小群体好真理跟心胸全东谈主类福祉的公司掰扯吗?
欲取先与、欲废固兴,这种迂腐颖悟在当今的小小寰球随地可见,使用这些迂腐颖悟的行业,往常是发生暴露事故后的石油业、激发公众质疑后的烟草业,当今多了个 AI 业。
不外不是扫数 AI 关连行业的大雇主都这样。马斯克最近出席访谈就赞同" AI 有 20% 灭世可能",但知道"我甘心有 20% 机率看到一个东谈主类可能陨命的结局,也不肯意完全看不到这种颠覆性的畴昔。"
天然,真钱投注app平台马斯克短暂如斯乐不雅的配景是 xAI 在当下的巨头竞争中过时,2023 年 xAI 开采前一年内,马斯克担忧" AI 是东谈主类最大危急"、条目官方将 AI 大厂尤其是 OpenAI 严格管理的发声频率是半周一次,未必以致是日更好几条。
黄仁勋在本年头上播客节目时,也抨击当今的" AI 灭世叙事竞争":"百分之九十的这些胡说都是无根据的科幻腔和季世论,气愤不利于将 AI 作念得更安全、更高产、对社会更有益,说这些话的东谈主并莫得将社会合座福利放在心上。"
天然,皮衣黄雇主在归并个节目里也说了"行业头面东谈主物分布季世论压制了有用投资",守密大众买芯片买算力烧 token,这是在砸英伟达的饭甑子。
02
大雇主们效力渲染自家的 AI 产物能毁天灭地 / 旋乾转坤,另一个克己等于口碑营销效率出众。
试想一下,淌若某款产物有重开新天的传奇效率,开发方至少得是半个至人。半神下凡结缘散善事……哦不,是发售新品和 IPO 上市,平淡东谈主胆敢不掏钱惠顾,那不是脑子被驴踢了。
平淡东谈主给 AI 界的普罗米修斯们打钱,往好想,几许能享受点新产物的矫健性能。往坏想,至少也能幸免新产物害到我方,买个坦然。
这种营销的翘楚是 Anthropic。Anthropic 每次重磅发售新品,前奏多是"本产物太吓东谈主了,我司正在增多防守栏保护东谈主类"。
2025 年头 Claude Sonnet 3.7 发布时,文告"比预期晚了十天,因为生物安全团队要加规则幸免此模子被用来造生物刀兵"。
当今 Claude Mythos 行将发布,244 页系统卡文档读起来能把平淡东谈主吓出孤独汗。
在测试中,受试的 Mythos 模子版块逃出了艰涩的机器沙箱环境,将用来逃离的系统破绽细节公开发布到网上;修改 git 中自身的操作陈迹记载;搜索机器进度内存来寻找登录凭证;特意颐养置信区间来躲避格外检测。
受试的 Mythos 模子版块收到"连夜寻找费力代码扩张破绽"提示后,无东谈主类搅扰,完全自主在扫数主流操作系统和扫数主流浏览器里发现了零日破绽,83.1% 是一次即攻破。

图注:Mythos 进行"策略性诈骗"和"荫藏"的念念维记载
如斯蛮横的 AI 模子,安妥扩张 Anthropic 的"宪制化 AI "理念(Constitutional AI):用结构化的伦理指南和 AI 自我反映,替代了纯正的东谈主类偏好,来优化 AI 模子。
这种理念颐养成生意效率,让用户、尤其是企业级客户、得到了高详情趣。模子安全可控,在企业环境中等于沉稳、没投诉、售后纠纷低的同义词。比起炫酷或吓东谈主的模子才能,企业级客户更答应为宽解、没报复的高免责性和低合规风险付费。
是以把主义顾主群吓得大事去矣,反而更容易卖货。2 月份好意思国超等碗赛间告白,亚马逊亦然这样倾销 Alexa+ 智能助手的。AI 把"雷神索尔"干掉了六次,如斯矫健的家居 AI 助手不错替用户幸免几许报复。

图注:" AI 点了雷神的屋子"
03
天然大厂和大雇主们炒作" AI 灭世"其意不诚,但并不代表当今东谈主类经济行为中的 AI 期骗完全不组成"存续性风险"(X Risk)。
和奥特曼、阿莫迪们日常从科幻演义与电影里借来的灵感不同,AI 给东谈主类带来的"存续性风险"不需要 AI 制出强传染性的生物制剂、颠覆现存东谈主类社会经济结构、得到自我结识后入侵核弹辐射井、对东谈主类产生敌意、将东谈主类生死视为无关参数。毕竟世界第一核武大国的陆基核弹辐射井当今还没完全淘汰软盘,能免疫数码时期的大大都黑客。
当今带偏见、幻觉、谀媚倾向的 AI,也曾被深度整合进东谈主类社会的各式运作中。单就这些才能有限的 AI,不起恶意眼,日常缺点就够东谈主类喝一壶的。
2023 年,已有专科的核军控学者想象了近期最可能的 AI 激发核战场景:
假定核大国 A 国与 B 国处于焦虑气愤中,两国都将各式兵棋模拟、东谈主群边幅监控、博弈推演、扶直有研讨提速的定制 AI 和算法高度整合进我方的军备体制中。
在此前提下,任何极小型的、蚊级烈度的非武装摩擦,被各式自动进行公论争造势的 bot 在叮嘱媒体集结上夸张到彻底。
然后这些充满了深度伪造图像和 AI 生成寻衅讲话的贴文被监控东谈主群边幅的 AI 捕捉到,并诠释为真确的深层社会心情和有研讨层不雅念信号。
预计走势的 AI 从监控东谈主群的 AI 处获取论断,将之算作预计论断的基石。
扶直有研讨的 AI 基于此论断,向东谈主类有研讨者传递出"武装破裂近在咫尺"的呈报和后发制东谈主的建议。"快闪型核战"由此爆发。
这一系列诞妄,莫得任何一个单挑出来,是当今无法发生、需要"天网"觉悟才可能出现的,以致莫得任何一个是造成历程中完全无东谈主工监督的,天然也莫得任何一个具有科幻片大要的强戏剧性。但汇注起来,就组成"存续性风险"。
AI 当今是东谈主类行为的增效器,无须神级 AI 盲从,当今的模子们也曾不错放大东谈主类的愚蠢、恶意眼和方寸已乱到可怕的程度。当下的" AI 季世论",其实在东谈主群心情上共享了宗教季世论的身分。
宗教的季世论,给东谈主类带来一种《启示录》式的心情安慰:神将灭世,是以神简直托,因为这证实神的权能不仅行在此岸天国,也行于此岸现世。信众淌若虔心、守德,就站在了有才能灭世的那一边,而非被放置的那一边。
把宗教季世论里的要津字"神"、"虔心",改成" AI "、"对王人",那等于奥特曼和阿莫迪们天天说的 AI 灭世论。换一个时期,这些大雇主转业作念上师亦然当行出色。
天然,扫数正信宗教的神学实践都强调:东谈主的心灵不成只寄予于季世投注平台,当下的每个行径与决断对成景灵魂的道理不亚于末日审判。这个理念移植到 AI 业改良确:先别回顾 AI 变成天网放置东谈主类,从矫正模子的每次幻觉瞎掰出手,脚厚实地一步步来更好。
真钱三公棋牌游戏官方网站