17
04
Anthropic 正在筹备 Opus 4.7 和全栈 AI 工作室——同时还要应对更可怕的事情
分类:要闻 | 时间:2026-04-17 06:19 | 关注
据Anthropic 正准备发布 Claude Opus 4.7,同时还将推出一款全新的 AI 设计工具,使用户能够通过简单的英语提示构建网站、演示文稿和落地页——这一消息导致 Adobe、Wix 和 Figma 的股价在周一下跌。信息.
一位知情人士透露,这些产品最早可能在本周上市。信息该设计工具的目标用户既包括开发人员,也包括非技术用户,这使得它与 Gamma 和 Google 的 Stitch 等初创公司展开了激烈的竞争。
人用制药公司没有回应解密请求置评。
Opus 4.7 甚至还不是 Anthropic 最强大的型号。这个头衔属于 Claude Mythos——一款专注于网络安全的强大产品,该公司正悄悄地将其交付给指定的几家安全公司,而并未向公众公开。
英国人工智能安全研究所最近对 Mythos Preview 进行了评估研究发现,Mythos 能够自主执行复杂的网络攻击,其速度之快,其他任何模型都无法匹敌。它成为首个完成“最后的挑战”的 AI,这是一项包含 32 个步骤的企业网络攻击模拟,通常需要人类红队花费 20 个小时才能完成。Mythos 在十次尝试中成功完成了三次,平均完成了 22 个步骤中的 22 个步骤——相比之下,Opus 4.6 只完成了 16 个步骤。
这不仅仅关乎企业安全。衡量人工智能的实际能力已成为一项重要任务。行业普遍面临的难题OpenAI 近期称领先的编码基准测试“已被污染”,但模型之间的比较仍然使用相同的测试。ARC-AGI-3 评估Gemini 的准确率仅为 0.37%,GPT-5.4 为 0.26%,而人类的准确率则高达 100%。由此导致的结果是,基准测试结果既存在争议,又被广泛用作证据,因此在 Anthropic 发布详细的模型卡片之前,我们很难对 Opus 4.7 的改进做出客观评价。
Opus 和 Mythos 之间的关系比大多数人意识到的要密切得多。Anthropic 通过在 Opus 产品线的基础上进行微调来构建其前沿模型——支撑公开 Claude 产品线的同一核心架构,经过压力测试和强化后,最终应用于 Mythos。Opus 4.7 是最终融入网络安全功能的基石。
此外,Anthropic 的努力也越来越倾向于开发/企业应用场景。泄露克劳德代码的发布技能系统和MCP协议、对智能AI的关注以及对编码基准的重视,都让这一点更加显而易见。虽然Anthropic尚未正式宣布,但泄露的信息强化了其从LLM提供商向类似全栈“AI工作室”模式的转变,在这种模式下,Claude不仅生成文本,还能构建和部署完整的产品。
温馨提示:内容仅供参考