Claude Sonnet 3.7

Name: Claude Sonnet 3.7
Author: Anthropic

聊天大模型SonnetClaude 3.7

Claude Sonnet 3.7

发布时间: 2025-02-25更新于: 2025-02-25 14:43:031,438

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

128K

中文支持

支持

推理能力

Claude Sonnet 3.7 是由 Anthropic 发布的 AI 模型，发布时间为 2025-02-25，定位为聊天大模型，上下文长度为 128K，采用不开源许可，在 MATH-500 上取得 82.20 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Claude Sonnet 3.7

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

128K tokens

最大输出长度

暂无数据

模型类型

聊天大模型

输入/输出模态

暂无数据

发布时间

2025-02-25

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

Claude Sonnet 3.7

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

暂无在线体验地址

Claude Sonnet 3.7

官方介绍与博客

官方论文

Claude 3.7 Sonnet and Claude Code

DataLearnerAI博客

Anthropic发布Claude 3.7 Sonnet大模型，全球最强编程模型再次进步。业界第一个既支持标准输出也支持扩展思考推理双重模式的单一大模型，评测结果超DeepSeek R1，低于Grok3-Beta Reasoning，免费用户可用

Claude Sonnet 3.7

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

Claude Sonnet 3.7

评测结果

Claude Sonnet 3.7 当前已收录的代表性评测结果包括 Aider-Polyglot（18 / 59，得分 64.90）、Simple Bench（31 / 63，得分 46.40）、GPQA Diamond（90 / 180，得分 77）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总数

GPQA Diamond

90 / 180

GPQA Diamond

124 / 180

HLE

10.30

138 / 164

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

SWE-bench Verified

70.30

56 / 109

SWE-bench Verified

62.30

75 / 109

数学推理

共 5 项评测

评测名称 / 模式

得分

排名/总数

MATH-500

82.20

41 / 44

AIME2025

54.80

84 / 106

AIME 2024

23.30

58 / 62

FrontierMath

4.10

41 / 60

FrontierMath

3.10

46 / 60

常识推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

Simple Bench

常规模式

44.90

35 / 63

Simple Bench

思考模式

46.40

31 / 63

Agent能力评测

共 5 项评测

评测名称 / 模式

得分

排名/总数

Aider-Polyglot

常规模式

60.40

21 / 59

Aider-Polyglot

32K

64.90

18 / 59

τ²-Bench

61.80

29 / 40

τ²-Bench - Telecom

31 / 35

Terminal Bench Hard

13 / 13

生产力知识

共 1 项评测

评测名称 / 模式

得分

排名/总数

GDPval-AA

20 / 21

长上下文能力

共 1 项评测

评测名称 / 模式

得分

排名/总数

AA-LCR

14 / 14

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

OSWorld-Verified

20 / 20

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Claude Sonnet 3.7

发布机构

Anthropic

查看发布机构详情

Claude Sonnet 3.7

模型解读

Claude 3.7 Sonnet是Anthropic发布的第四代大语言模型，相比较Claude Sonnet 3.5模型，Claude Sonnet 3.7能力大幅提升。Claude Sonnet 3.7是经典的大语言模型，它还有一个支持“推理”模式的大语言模型。

2025年2月14日，推特上有用户发现Anthropic在官网和APP上有代码更新，显示Anthropic即将发布新的大模型，就是这个Claude 3.7 Sonnet大模型。2025年2月24日，AWS官网更新了模型的介绍内容。

Claude 3.7 Sonnet 是 Anthropic 至今最智能的模型，也是首个提供扩展思维能力的 Claude 模型——能够通过仔细的逐步推理解决复杂问题。

Anthropic 是第一个推出单一模型的 AI 实验室，用户可以根据需要选择标准思维模式，以实现近乎即时的响应，或选择扩展思维模式进行更高级的推理，从而在速度与质量之间找到平衡。

Claude 3.7 Sonnet 在编程领域具有领先地位，并在计算机使用、智能代理能力、复杂推理和内容生成等方面取得了突破。凭借前沿的性能和对速度的更大控制，Claude 3.7 Sonnet 是驱动 AI 代理的理想选择，尤其适用于面向客户的代理和复杂的 AI 工作流程。

至于为什么叫Claude 3.7 Sonnet，社区认为此前2024年10月份发布的Claude 3.5 Sonnet (New)就是Claude 3.6 Sonnet 。此次应该是为了避免大家混淆，所以取名Claude 3.7 Sonnet。

支持的应用场景：基于大量知识的检索与获取（RAG），产品推荐，预测，精准营销，代码生成，质量控制，从图片中解析文本，智能计算机使用，内容生成。

模型特点：推理，文本生成，代码生成，富文本格式化，智能计算机使用。

以下是更详细的介绍，原文参考： https://www.datalearner.com/blog/1051740051841021

Claude 3.7 Sonnet与其它模型对比参考： https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=32,36,37,35&modelInputString=513,512,511,501,495,492

2025年2月25日，Anthropic 公司正式发布了 Claude 3.7 Sonnet 大模型，这一版本在多项能力上实现了显著提升，尤其是代码能力的增强，使其在编程领域更具竞争力。

一、Claude 3.7 Sonnet 大模型简介

Claude 3.7 Sonnet 是业界首个支持双重输出模式的大模型，既支持标准输出模式，也支持深度推理模式。其中，深度推理模式被称为 Claude 3.7 Sonnet with 64K extended thinking，最多支持 128K 长度的输出。这一特性使得模型在处理复杂问题时，能够提供更加详细的推理过程，帮助用户更好地理解模型的思考逻辑。

二、推理过程公开

Anthropic 决定在 Claude 3.7 Sonnet 中公开推理过程，旨在提升用户体验和信任，支持安全性研究。用户可以观察到模型的思维链条，从而更信任输出结果。同时，这为研究人员提供了研究模型行为的机会，有助于探讨扩展思维链条对模型性能的影响。然而，Anthropic 也指出，这一做法可能会带来滥用风险，未来可能会根据研究和反馈进行调整。

三、性能和评测效果

Claude 3.7 Sonnet 在代码和前端网页开发方面表现出色。与 Claude 3.5 Sonnet 相比，其编程水平有了显著提升。在 SWE-Bench 等现实场景的编程评测中，Claude 3.7 Sonnet 不使用推理模式也大幅优于其他模型。虽然在数学推理方面略逊于 OpenAI o1 和 DeepSeek-R1 等模型，但在常识推理和编程方面表现优异。

四、Claude Code 编程 Agent 系统

Anthropic 推出了 Claude Code 编程 Agent 系统，这是一款具备自主行动能力的编程工具，目前处于有限的研究预览阶段。Claude Code 能够搜索和阅读代码、编辑文件、编写和运行测试，还能将代码提交至 GitHub，甚至使用命令行工具。它在测试驱动开发、复杂问题调试和大规模重构方面表现出色，能够显著减少开发时间和工作量。

五、对用户开放及 API 接口

Claude 3.7 Sonnet 模型已在官网开放使用，免费用户和付费用户均可使用，但免费用户无法使用深度思考模式。此外，AWS 和 Google 等云服务也提供了 Claude 3.7 Sonnet 的 API 接口服务。API 接口价格与上一版本相同，输入每 100 万 tokens 3 美元，输出每 100 万 tokens 15 美元。

总之，Claude 3.7 Sonnet 的发布标志着 Anthropic 在大模型领域的又一次重要进步，其双重模式和编程能力的提升，使其在编程领域更具竞争力，为开发者提供了更强大的工具支持。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送