正文

Anthropic发布超强模型Claude Mythos Preview,代码与推理能力远超前代

编辑:Lunc发布时间:8小时前

Anthropic推出Claude Mythos Preview:神话级AI模型诞生

Anthropic今日宣布启动“玻璃翼计划”(Project Glasswing),并推出全新的超强AI模型Claude Mythos Preview。该模型在代码生成、推理能力以及漏洞检测方面表现出色,甚至超越了此前发布的Opus 4.6版本。

ZAGddQegxFNJnSiQwNFvQnS8RuTSDb0EEFrxvN39.jpeg

强大性能:代码与推理能力全面领先

Claude Mythos Preview的性能数据令人瞩目,尤其是在代码生成和推理任务中表现尤为突出:

代码能力:

fRpO6XNwQkUvfaYC0pQKpx8VhJ7qnVf7kWC1zf6f.jpeg

推理能力:

6gYIoVjB955If7LSZGYIWRQ0JUbvX49LhGfRVMUQ.jpeg

搜索与计算机使用:

ViaSPcPWeDSJmeBOYHoFlTFLuChqAfLCqfINsnWD.jpeg

玻璃翼计划:联合12家机构共同应对网络安全挑战

为了确保模型的安全性,Claude Mythos Preview不会向公众开放,而是仅限于认可的机构内部使用。项目参与方包括亚马逊AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达、Palo Alto Networks,以及Anthropic自身,共12家机构联合发起。

Anthropic的目标是通过这一计划,帮助合作伙伴扫描和修复核心系统中的漏洞,同时开发和验证相关的安全防护机制,为未来的模型迭代奠定基础。

发现数千个零日漏洞:模型的实际应用成果

在过去几周,Anthropic利用Claude Mythos Preview对主流操作系统、浏览器和其他重要软件进行了扫描,结果发现了数千个此前未被发现的零日漏洞,其中许多被评定为高危级别。以下是几个具体案例:

  • OpenBSD中的27年漏洞:允许攻击者远程崩溃目标机器。
  • FFmpeg中的16年漏洞:被自动化测试工具扫描500万次仍未被发现。
  • Linux内核中的多漏洞串联:可将普通用户权限提升至完全控制整台机器。

以上漏洞均已报告给相关维护方并完成修复,其余漏洞则已发布加密哈希值,待修复完成后公开细节。

为什么选择主动防御?

Anthropic认为,AI模型在发现和利用软件漏洞方面的能力已经超过了除少数顶级人类专家之外的所有人。这种能力的扩散只是时间问题,而非是否会发生的问题。全球网络犯罪每年造成的经济损失高达5000亿美元,针对医疗系统、能源基础设施和政府机构的攻击已造成实质伤害。

Anthropic的逻辑是:与其等待他人将这种能力用于进攻,不如主动将其用于防御。

计划实施的具体步骤

Project Glasswing目前分为两个层面:

  1. 第一层面:12家创始合作伙伴将获得Claude Mythos Preview的访问权限,用于扫描和修复自身核心系统的漏洞。
  2. 第二层面:另外40余家构建或维护关键软件基础设施的组织也将获得模型访问权限。

Anthropic承诺提供最高1亿美元的模型使用额度,并通过Linux基金会捐赠400万美元支持开源软件维护。

未来展望:信息共享与政策建议

在信息共享方面,合作伙伴将互通信息和最佳实践。Anthropic承诺在90天内发布研究进展报告,内容包括发现的漏洞数量、已修复的问题以及改进成果。

此外,Anthropic还将与主要安全机构合作,就漏洞披露流程、软件更新流程等方向形成实践建议。

完整信息见官方原文:https://www.anthropic.com/glasswing