这对一家将AI安全作为核心品牌形象的公司而言实属难堪。Anthropic对Claude Mythos的严格管控推出计划近日出现了令人尴尬的转折。该公司此前数周一再强调这款AI模型在网络安全领域的能力过于强大危险性过高因此不宜向公众开放。然而讽刺的是该模型最终还是落入了未经授权人员的手中。据彭博社报道自Anthropic宣布计划向少数企业提供Mythos测试访问权限当天起一个小规模未授权用户群体便已获得了该模型的访问途径——而Mythos的存在本身最初也是通过一次信息泄露才得以曝光。目前Anthropic表示正在调查此事。对于一家以认真对待AI安全为立身之本、同时大力宣传其最新模型网络安全能力的公司来说这无疑是相当难堪的局面。从技术角度来看此次Mythos泄露事件令人尴尬的原因在于其入侵手段极为低级。彭博社报道称该群体是通过对模型在线位置进行有根据的猜测而获得访问权限的。他们利用了AI培训数据公司Mercor遭受数据泄露后暴露的Anthropic其他模型相关信息加上其中一名成员此前曾以合同工身份参与Anthropic模型评估工作而获得的内部权限。整个入侵过程结合了内部知识与运气成分而非依赖某种复杂的技术手段或对模型的全面窃取。Anthropic未能预防完全可以预见的安全漏洞安全漏洞在所难免且向黑客提供关键信息的是Mercor而非Anthropic本身。英国皇家联合军种研究所RUSI研究员皮娅·许施告诉我没有任何公司能做到万无一失人为因素往往是最薄弱的环节尽管此次事件初看之下确实带有一定运气成分未造成严重后果。然而这并非纯粹的运气问题。此类有根据的猜测是极为常见的黑客攻击手段而Mercor的数据泄露在Mythos发布之前便已是公开的事实。安全研究员卢卡什·奥列伊尼克在接受我采访时将其描述为一种完全可以预见的失误——网络安全行业在过去20年里已对此类攻击司空见惯。因此Anthropic本应预判到这一风险并做好相应准备尤其是在已知自身信息遭到泄露的情况下更应如此。奥列伊尼克还指出Anthropic原本具备发现此次入侵的技术手段。该公司能够对模型使用情况进行日志记录与追踪这本应使其能够阻止未授权或恶意访问——尤其是考虑到Mythos的推出范围原本应极为有限。显然Anthropic的监控力度远远不够。鉴于该公司一再强调这款模型的危险性外界有理由追问为何监管如此松懈据彭博社报道该群体并未将Mythos用于网络安全攻击任务部分原因是他们只是想探索这款新模型另一部分原因则是这样做可能会惊动Anthropic。如果Anthropic围绕Mythos发出的警示值得认真对待那么这算是不幸中的万幸。该公司将Mythos定位为网络安全领域的里程碑声称其发现了所有主流操作系统和网络浏览器中的安全漏洞并表示其发布必须经过统筹协调以留出时间强化全球网络防御体系。Anthropic惯于使用戏剧性的、听起来令人警觉的措辞这类表述有时难以得到清晰验证甚至包括暗示其Claude模型可能具有意识的说法。尽管如此来自有权访问该模型各方的早期报告显示Mythos在网络安全领域确实表现出色。Mozilla首席技术官博比·霍利表示该模型在Firefox 150中发现了数百个漏洞或许能让防御方在对抗攻击者的博弈中首次取得全面胜利。不出意外世界各地的政府机构和金融机构都对其趋之若鹜。据报道尽管Anthropic被列为供应链风险美国国家安全局及其他美国机构仍获得了访问权限但此次推出似乎尚未将美国网络安全和基础设施安全局CISA纳入其中。Anthropic声称自己站在这些技术的绝对最前沿同时也将自己定位为这一切中负责任的行为者。此次入侵事件由记者而非Anthropic自身发现这一事实不禁令人追问这是否只是一起孤立事件许施表示这真实地揭示了潜在实施者群体的规模有多广泛即便他们并不具备高度复杂的技术手段。Anthropic很可能会对其供应链展开全面排查弄清事件原委并堵塞漏洞但她指出想要获取此类模型访问权限的行为者范围极广其中不乏资金雄厚者。没有理由假设其他可能已获得访问权限的人会像彭博社报道中提及的那个群体一样保持克制。某种程度上Anthropic是在自食其果。该公司的品牌形象建立在比竞争对手更认真对待AI安全的基础之上这为其模型安全树立了极高的预期标准而此次明显的疏忽与之形成了强烈反差尤其是Mythos竟通过如此基础且可预见的漏洞遭到入侵更加凸显了这一落差。更糟糕的是Anthropic将Mythos大力渲染为一款能力非凡、危险性过高而不宜公开发布的工具这反而使其成为了众矢之的——无论是对恶意攻击者还是对那些单纯寻求挑战的黑客而言皆是如此。这甚至不是Mythos首次陷入安全尴尬。该模型的存在此前曾在正式发布前通过其网站内容所在中央系统上的一处不安全数据存储意外泄露。如今该模型又通过一个完全可以预见、Anthropic却未想到予以修补的漏洞遭到秘密访问。完美固然无从企及但对于一家自诩为AI安全领域先锋的公司而言如此基础性的失误实难辩解即便考虑到其所遭遇的部分运气不佳因素亦是如此。在许施看来整件事可以用一个词来概括羞耻。Anthropic声称自己站在这些技术的绝对最前沿同时也将自己定位为这一切中负责任的行为者她说而如今该模型竟在如此短的时间内通过未授权手段、以如此低级的尝试遭到访问这对他们而言是真正的羞耻。QAQ1Claude Mythos是什么模型为什么不对外公开发布AClaude Mythos是Anthropic开发的一款AI模型该公司声称其在网络安全领域能力极强曾发现所有主流操作系统和浏览器中的漏洞。正因如此Anthropic认为公开发布风险过高仅向少数经过筛选的企业提供测试访问权限并表示需要统筹协调发布时间以留出强化全球网络防御体系的准备时间。Q2黑客是如何入侵Mythos的技术手段复杂吗A入侵手段并不复杂。未授权群体通过对模型在线位置进行有根据的猜测获得访问权限所利用的信息来自AI培训数据公司Mercor此前遭受的数据泄露加上一名成员曾以合同工身份评估Anthropic模型时获得的内部知识。安全研究员将其描述为网络安全行业20年来已司空见惯的完全可以预见的攻击方式。Q3Anthropic此次安全事故暴露了哪些管理问题A主要暴露了两方面问题一是风险预判不足Mercor数据泄露在Mythos发布前便已公开Anthropic理应提前预判并修补相关漏洞二是监控缺位该公司本具备对模型使用情况进行日志记录与追踪的技术能力却未能及时发现未授权访问最终还是由媒体记者而非公司自身披露了这一事件。