Claude Opus 4.7 评测(2026):定价、设计、状态、AI 与常见问题解答

Table of Contents
2026年4月16日,当Anthropic悄然推出Claude Opus 4.7时,我们《努比亚杂志》团队已经对其进行了数周的真实工作负载测试。我们之所以在充分使用该模型后才撰写这篇评测,是因为我们想了解它在日常使用中的真实感受,而不仅仅是看新闻稿中的基准测试数据。因此,我们对其进行了编码会话、文档审阅、图像分析、创意写作,以及大量的压力测试,试图将其推到极限。
我们发现,这是一款在原有Opus系列基础上,在最关键的方面进行了锐化升级的模型。它并非华而不实的重新设计。这种升级只有在你使用一周后,当你意识到自己不再需要像保姆一样盯着它完成长任务时,才能完全体会到其价值。以下是《努比亚杂志》对定价、设计、状态、AI能力、用户体验以及读者们关于此次发布不断提出的问题的全面解析。

Claude Opus 4.7 概览
在深入长篇评测之前,我们先简要介绍一下该模型的概况,以及它在2026年Anthropic产品线中的位置。
Claude Opus 4.7 档案 | 详细信息 |
|---|---|
产品名称 | Claude Opus 4.7 |
开发者 | Anthropic |
模型ID | claude-opus-4-7 |
发布日期 | 2026年4月16日 |
类别 | 大型语言模型 (LLM), 智能体AI |
上下文窗口 | 100万 tokens |
最大输出Tokens | 128,000 tokens |
图像分辨率限制 | 2,576 px / 3.75 百万像素 |
API 定价 | 每百万输入tokens 5美元,每百万输出tokens 25美元 |
消费者套餐 | 免费版, Pro ($20/月), Max ($100 或 $200/月), 团队版, 企业版 |
可用平台 | Claude.ai, Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry, GitHub Copilot |
总部 | 美国加利福尼亚州旧金山 |
前代产品 | Claude Opus 4.6 |
努比亚杂志评分 | 4.6 / 5 |
现状:2026年Claude Opus 4.7的地位
Claude Opus 4.7是目前Anthropic向公众提供的最强大的Claude模型。它在产品家族中位于Sonnet 4.6和Haiku 4.5之上,并直接取代Opus 4.6成为默认的高端选择。Anthropic内部仍保留着一个更强大的模型,名为Claude Mythos Preview,但Mythos并未广泛开放,大多数日常用户不会接触到它。就实际应用而言,Opus 4.7是公共产品阶梯的顶端。
在发布时间上,该版本于2026年4月16日推出,距离2026年2月初发布的Opus 4.6仅隔了几个月。如此快速的更迭,部分是为了回应公众对Opus 4.6在长编码任务上表现不稳定的批评。通过4.7版本,Anthropic实质上是在宣告该问题已得到解决,而基准测试也证实了这一点。
该模型在你能想到的旗舰Claude发布所覆盖的所有平台上均可使用。你可以在Claude.ai上为Pro、Max、团队和企业版订阅用户使用它,通过Claude API以claude-opus-4-7的模型ID访问,也可以在Amazon Bedrock、Google Cloud Vertex AI和Microsoft Foundry上使用。GitHub也确认Opus 4.7正在GitHub Copilot中推出,这意味着许多开发者无需打开claude.ai就能开始使用它。
设计:界面、输出质量和视觉工作
Claude Opus 4.7并非实体产品,因此这里的设计有两层含义:模型在Claude界面中的呈现方式,以及当你要求它为你设计东西时,其输出的整洁度。
Claude.ai 体验
在消费者端,Claude.ai界面仍然是AI领域最简洁的聊天界面之一。聊天窗口宽敞,排版清晰易读,当Claude生成代码、文档或视觉内容时,右侧打开的人工制品面板非常实用。Opus 4.7作为付费用户模型选择器中的默认选项嵌入此界面,因此大多数人无需进行任何切换即可开始使用。
我们注意到,思考内容现在默认是隐藏的。在早期的Opus版本中,你可以实时观察Claude的推理过程,虽然感觉慢,但让人安心。在4.7版本中,模型会静默思考,然后给出更精炼的答案。这样做的代价是,有时你需要等待更长时间,屏幕上才会出现任何文字。高级用户可以通过设置开关重新开启此功能,但默认行为更倾向于最终输出的流畅性,而非展示进行中的工作。
输出质量和品味

这是真正让我们感到惊喜的地方。Anthropic一直在推动将“品味”作为一项质量指标,而Opus 4.7终于让人感觉是一个默认就拥有良好品味的模型。当我们要求它起草幻灯片、设计简单的着陆页或格式化报告时,其布局选择明显优于4.6版本。标题位置得当,间距感觉是经过精心设计的,色彩搭配看起来也不像来自现成的模板。它仍然受益于清晰的指令,但当你要求它输出精致内容时,它不再与你对抗。
视觉能力的升级也提升了设计质量。Opus 4.7现在可以读取长边高达2,576像素的图像,大约3.75百万像素。这比Opus 4.6能处理的分辨率高出三倍多。在实践中,这意味着它能够真正读取截图中的小字、理解复杂的Figma导出文件、解析密集的图表,而不会产生幻觉,编造出不存在的元素。如果你处理的是模型、仪表盘或扫描文档,仅此一项改变就值得升级。
AI:能力、编码和智能体工作
Claude Opus 4.7基于100万tokens的上下文窗口构建,每次响应最多可输出128,000 tokens。自适应思考默认开启,这意味着模型会自行决定对某个问题的推理深度,而不是在每个简单问题上都消耗tokens。此外,还有一个名为xhigh的新努力级别,介于high和max之间,让开发者能更精细地控制模型在任务上的投入程度。
编码性能
编码是Opus 4.7的亮点领域。在SWE-bench Verified基准测试中,该模型从Opus 4.6的80.8%跃升至87.6%。在难度更高的SWE-bench Pro上,它从53.4%提升至64.3%,这是我们很长一段时间以来看到的单版本最大进步之一。我们在自己一些杂乱的代码库上进行了测试,这种差异是你能感受到而非仅仅测量到的。它在编写代码前会进行规划,能捕捉自身的逻辑错误,并且很少陷入4.6版本在处理多文件任务时有时会陷入的循环中。
在Claude Code内部,新的/ultrareview命令会运行一个多智能体审查流程,能够捕捉单次审查可能遗漏的设计缺陷和错误。还有一个/recap命令,允许你无需重新输入上下文即可返回之前的会话。自动模式(允许智能体在无需每一步都请求许可的情况下运行更长时间)现在在Max计划中可用,而不仅限于团队版和企业版。
智能体与长周期工作
长期运行的智能体是Opus 4.7默默发光的领域。该模型在MCP Atlas基准测试中得分77.3%,该测试衡量模型处理复杂的多工具智能体任务的能力。Anthropic还增加了一项名为“任务预算”的新功能(目前处于测试阶段),你可以给模型设定一个tokens上限,模型在工作时会看到一个实时倒计时。模型会利用这个倒计时来设定优先级并优雅地完成任务,而不是在任务中途被截断。对于过夜运行的编码智能体来说,这确实是一个生产级的成本控制功能。
有一个合理的警告。与Opus 4.6相比,网络研究能力实际上略有下降。在BrowseComp基准测试中,GPT-5.4仍然领先。因此,如果你的主要用例是依赖大量实时网络爬取的研究工作,Opus 4.7并非自动成为最佳选择。
用户体验:与Opus 4.7共处
在使用这个模型数周后,我们感受最深的变化是减少了“保姆式”的监督。使用Opus 4.6时,长任务需要密切监督,因为模型有时会偏离方向、丢失指令,或者在半途中悄悄停止遵循格式。Opus 4.7则自律得多。它严格遵循指令,在报告结果前会验证自己的工作,并在数据缺失时承认,而不是编造一个看似合理的答案。
指令遵循方面的变化值得指出,因为它是一把双刃剑。如果你以前依赖Claude去领会言外之意并自行推断语气或风格,你可能会注意到新模型感觉有点平淡,除非你明确说明语气。使用系统提示或个人风格技能文件的高级用户不会感觉到这一点。而输入简短指令并期望模型创造性解读的普通用户,可能需要额外添加一两句关于语气的说明。
记忆和多会话工作也得到了改进。Opus 4.7在跨长会话读写基于文件系统的记忆方面有了显著提升。如果你构建的流程是一个会话写下笔记,供下一个会话读取,那么这个版本实际上表现得像是记住了。之前的版本在理论上可以处理,但在实践中感觉不一致。
在速度方面,由于思考过程被隐藏,初始响应时间感觉稍慢,但在同等努力级别下,处理困难任务的实际端到端延迟优于4.6版本。Anthropic声称,低努力级别的4.7大致相当于中等努力级别的4.6,这与我们在编码测试中看到的情况相符。
定价:实际成本是多少
Anthropic保持了与Opus 4.6相同的API价格。每百万输入tokens收费5美元,每百万输出tokens收费25美元。输出价格始终是输入的五倍,这是为任何Claude工作负载做预算时最重要的规则。
消费者套餐
- 免费版:提供对Sonnet 4.6和基本功能的访问,但不包含Opus 4.7。有每日限制。
- Pro版:每月20美元,或年度计划每月17美元。这是个人使用Opus 4.7最便宜的途径。
- Max版:每月100美元,享受五倍于Pro的容量;或每月200美元,享受二十倍于Pro的容量。最适合重度Claude Code或Cowork用户。
- 团队版:按年计费时,每个席位每月25美元起。团队高级版按年计费为每个席位每月100美元,这是大多数团队为严肃使用Claude Code所需的层级。
- 企业版:通过Anthropic销售团队定制定价,包括SCIM、审计日志、HIPAA合规、IP白名单,以及可单独协商的50万tokens上下文选项。
隐藏的Tokenizer成本
有一个重要的细节在发布头条中无人提及。Opus 4.7配备了一个新的tokenizer,与早期的Claude模型相比,对于相同的输入文本,它最多可能产生35%更多的tokens。标价是相同的,但即使费率卡从未变动,你每次请求的实际账单可能会增加。如果你正从API上的Opus 4.6迁移到4.7,请在更改生产环境默认设置之前,回放一组有代表性的真实提示词并测量token数量。
好消息是,折扣机制仍然有效。对于重复的上下文,提示缓存可以将输入成本降低高达90%;对于非紧急工作负载,批量API在此基础上再提供50%的折扣。如果使用得当,这两者结合可以将Opus 4.7的成本降低到接近或低于你在没有缓存的情况下使用Opus 4.6所需支付的费用。

努比亚杂志评测结论
Claude Opus 4.7是那种不会高调宣扬自己,但会悄然提升你使用AI模型所能达到的基准水平的更新之一。它在智能体编码方面是同类最佳,视觉能力非常强大,在长周期和多步骤工作方面明显优于其前代产品。它不是实时网络研究的最佳选择,新的tokenizer意味着API用户应在迁移前进行测试。对于其他所有人来说,这现在是2026年严肃知识工作领域需要超越的模型。
我们对Claude Opus 4.7的《努比亚杂志》总体评分为4.6分(满分5分)。下面的细分显示了分数的来源以及Anthropic仍有改进空间的地方。
类别 | 评分 (满分5分) |
|---|---|
性能与智能 | 4.8 |
编码与智能体任务 | 4.9 |
视觉与图像理解 | 4.8 |
用户体验与界面 | 4.5 |
定价与性价比 | 4.2 |
设计与输出质量 | 4.6 |
可靠性与状态 | 4.5 |
总体评分 | 4.6 |
2026年关于Claude Opus 4.7的常见问题解答
1. Claude Opus 4.7是什么时候发布的?
Anthropic于2026年4月16日正式发布了Claude Opus 4.7。它取代了仅在约两个月前(2026年2月5日)发布的Claude Opus 4.6。
2. Claude Opus 4.7的价格是多少?
在API上,Claude Opus 4.7每百万输入tokens收费5美元,每百万输出tokens收费25美元。对于消费者使用,你可以通过每月20美元的Claude Pro、每月100或200美元的Max、每个席位每月25美元起的团队计划,或定制的企业定价来访问它。
3. Claude Opus 4.7比GPT-5.4和Gemini 3.1 Pro更好吗?
这取决于具体任务。Opus 4.7在SWE-bench Pro和SWE-bench Verified等编码基准测试、MCP Atlas衡量的多工具智能体工作、计算机使用以及通过GPQA Diamond衡量的科学推理方面处于领先地位。GPT-5.4在通过BrowseComp衡量的网络搜索方面仍然领先。Gemini 3.1 Pro在多语言任务上仍具竞争力。对于编码和智能体工作流程,截至2026年4月,Opus 4.7是最强大的公开可用选项。
4. 与Opus 4.6相比,Claude Opus 4.7有哪些新功能?
主要变化包括:更强的编码性能;处理图像分辨率超过前代三倍的视觉系统;用于更精细控制推理深度的新xhigh努力级别;用于智能体循环成本控制的测试版任务预算;Claude Code中的/ultrareview命令;Max计划中可用的自动模式;以及一个新的tokenizer,对于相同的输入文本,最多可能使用35%更多的tokens。
5. 我可以免费使用Claude Opus 4.7吗?
不可以。免费的Claude.ai层级仅包含Sonnet 4.6和基本功能。要使用Opus 4.7,你需要一个付费计划,如Pro、Max、团队版或企业版,或者通过Claude API按token付费。一些第三方平台也提供试用积分,但官方免费层级不包括Opus。
6. Claude Opus 4.7支持图像和文档分析吗?
是的,这是其最大的改进之一。该模型现在可以读取长边高达2,576像素的图像,大约3.75百万像素。这足以读取截图中的小字、理解详细的设计模型,并准确分析密集的图表或扫描文档。它还能在Claude.ai内原生处理PDF、电子表格和长篇文档。
7. 开发者在哪里可以访问Claude Opus 4.7?
开发者可以通过使用模型ID claude-opus-4-7的Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry以及GitHub Copilot访问Opus 4.7。该模型还支持提示缓存(缓存输入可享受90%折扣),以及通过批量API为非紧急工作负载提供50%的折扣。
8. Claude Opus 4.7对敏感或企业用途安全吗?
Anthropic为Opus 4.7配备了新的自动化网络安全防护措施,可以检测并阻止与被禁止或高风险网络用途相关的请求。企业计划增加了SCIM、审计日志、HIPAA合规、IP白名单和合规API。从事合法漏洞研究、渗透测试或红队演练的安全专业人士可以通过网络安全验证计划申请扩展访问权限。
9. Claude Opus 4.7的主要缺点是什么?
有三个诚实的缺点。通过BrowseComp衡量的网络研究能力相比Opus 4.6略有下降。新的tokenizer可能会在API上悄悄地将有效成本提高12%到35%,即使费率卡没有变化。在消息API中将temperature、top_p或top_k设置为非默认值现在会返回400错误,这移除了开发者在以前版本中拥有的一些细粒度采样控制。
10. 我现在应该从Opus 4.6升级到4.7吗?
如果你是Claude Pro或Max订阅用户,是的。该模型已包含在你的计划中,并且在编码、视觉和长智能体工作流程方面有显著改进。如果你通过API在生产环境中运行Opus 4.6,请在切换前至少用真实提示词测试Opus 4.7一周。能力提升是真实的,但tokenizer的变化意味着你应该验证你的有效成本,而不是假设不变的费率卡能直接换算。
Claude Opus 4.7并非那种能在一夜之间重置AI行业的发布。它是一次专注、自信的升级,解决了正确的问题。在与它共处数周后,我们的团队可以放心地说,它已赢得2026年公众可用的最佳通用AI模型之一的地位。凭借4.6分(满分5分)的最终得分,这是我们明确推荐的产品,尤其适合那些希望拥有一个能够处理困难、长期、多步骤工作且无需持续监督的模型的开发者、知识工作者和设计团队。
随着Anthropic发布新的补丁,特别是围绕tokenizer成本问题以及未来任何Mythos级别模型普遍可用的动向,我们将持续更新这篇评测。
Related Posts
1 Comment
Join the discussion and share your thoughts





