DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tools

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Page navigation
目录
Model catalogClaude Opus 4
CL

Claude Opus 4

Claude Opus 4

Release date: 2025-05-23更新于: 2025-05-25 09:48:391,301
Live demoGitHubHugging FaceCompare
Parameters
Not disclosed
Context length
200K
Chinese support
Supported
Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Claude Opus 4

Model basics

Reasoning traces
Supported
Thinking modes
Thinking modes not supported
Context length
200K tokens
Max output length
32000 tokens
Model type
推理大模型
Release date
2025-05-23
Model file size
No data
MoE architecture
No
Total params / Active params
No data / N/A
Knowledge cutoff
No data
Claude Opus 4

Open source & experience

Code license
不开源
Weights license
不开源- 不开源
GitHub repo
GitHub link unavailable
Hugging Face
Hugging Face link unavailable
Live demo
https://claude.ai/new
Claude Opus 4

Official resources

Paper
Introducing Claude 4
DataLearnerAI blog
Anthropic发布Claude4,全球最强编程大模型,大幅提升AI Agent系统所需的各项能力,最长可以7小时连续工作,80%工程任务自主完成
Claude Opus 4

API details

API speed
3/5
💡Default unit: $/1M tokens. If vendors use other units, follow their published pricing.
Standard pricingStandard
ModalityInputOutput
Text$15$75
Image$15--
Claude Opus 4

Benchmark Results

Thinking
All modesNormalThinking
Thinking mode details (2)
All thinking modesDefault (On)Medium
Tool usage
All modesWith toolsNo tools

数学推理

3 evaluations
Benchmark / mode
Score
Rank/total
FrontierMath
Medium
4.10
36 / 55
FrontierMath - Tier 4
Medium
4.20
14 / 34
IMO-ProofBench
Medium
2.90
16 / 16

常识推理

1 evaluations
Benchmark / mode
Score
Rank/total
Simple Bench
Medium
58.80
7 / 27

Agent能力评测

2 evaluations
Benchmark / mode
Score
Rank/total
τ²-Bench
OnWith tools
72.50
22 / 39
Aider-Polyglot
Medium
72
8 / 26
查看评测深度分析与其他模型对比
Claude Opus 4

Publisher

Anthropic
Anthropic
View publisher details
Claude Opus 4

Model Overview

Anthropic 近日推出了 Claude Opus 4,这是其迄今为止最智能的模型,旨在推动编码、代理搜索和创意写作领域的界限。作为 Claude 模型家族中的旗舰产品,Opus 4 代表了人工智能在复杂推理和自主工作方面的显著进步。

核心能力与应用场景

Claude Opus 4 被设计为一种混合推理模型,能够提供即时响应,也能进行分步思考,并通过用户友好的摘要展示其推理过程。对于 API 用户,该模型提供了对思考预算的精细控制,以优化成本和性能。其主要应用场景包括:

      关键特性与性能

      Claude Opus 4 在多项基准测试中取得了业界领先的成果,包括编码方面的 SWE-bench,以及 MMLU、GPQA 和 Aider Polyglot。它还以卓越的写作能力超越了之前的 Claude 模型,为自然、类人散文设定了新标准。该模型拥有一个 200K 的上下文窗口。Anthropic 还特别提到,Opus 4 使得在后台运行 Claude Code 成为可能,允许开发者分配长时间运行的编码任务,由 Opus 独立处理。

      可用性与定价

      Claude Opus 4 面向需要与 Anthropic 最强大模型协作处理复杂任务的商业用户和消费者,可通过 Claude for Pro、Max、Team 和 Enterprise 用户获得。对于有兴趣构建需要前沿智能的 AI 解决方案的开发者,Claude Opus 4 可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问。定价方面,Claude Opus 4 的输入 token 价格为每百万美元 15 美元,输出 token 价格为每百万美元 75 美元,通过即时缓存可节省高达 90% 的成本,通过批量处理可节省 50% 的成本。

      DataLearner 官方微信

      欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

      DataLearner 官方微信二维码