Cl

Claude Sonnet 3.7

聊天大模型

Claude Sonnet 3.7

发布时间: 2025-02-25

模型参数(Parameters)
未披露
最高上下文长度(Context Length)
128K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

128K tokens

最长输出结果
暂无数据
模型类型

聊天大模型

发布时间

2025-02-25

模型预文件大小
暂无数据

开源和体验地址

代码开源状态
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址

API接口信息

接口速度(满分5分)
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

Claude Sonnet 3.7模型在各大评测榜单的评分

评测基准名称
GPQA Diamond
(常识推理)
评测结果:68.0
评测基准名称
SWE-bench Verified
(代码生成)
评测结果:70.3
评测基准名称
MATH-500
(数学推理)
评测结果:82.2
评测基准名称
AIME 2024
(数学推理)
评测结果:23.3

发布机构

模型介绍

Claude 3.7 Sonnet是Anthropic发布的第四代大语言模型,相比较Claude Sonnet 3.5模型,Claude Sonnet 3.7能力大幅提升。Claude Sonnet 3.7是经典的大语言模型,它还有一个支持“推理”模式的大语言模型。


2025年2月14日,推特上有用户发现Anthropic在官网和APP上有代码更新,显示Anthropic即将发布新的大模型,就是这个Claude 3.7 Sonnet大模型。2025年2月24日,AWS官网更新了模型的介绍内容。


Claude 3.7 Sonnet 是 Anthropic 至今最智能的模型,也是首个提供扩展思维能力的 Claude 模型——能够通过仔细的逐步推理解决复杂问题。

Anthropic 是第一个推出单一模型的 AI 实验室,用户可以根据需要选择标准思维模式,以实现近乎即时的响应,或选择扩展思维模式进行更高级的推理,从而在速度与质量之间找到平衡。


Claude 3.7 Sonnet 在编程领域具有领先地位,并在计算机使用、智能代理能力、复杂推理和内容生成等方面取得了突破。凭借前沿的性能和对速度的更大控制,Claude 3.7 Sonnet 是驱动 AI 代理的理想选择,尤其适用于面向客户的代理和复杂的 AI 工作流程。


至于为什么叫Claude 3.7 Sonnet,社区认为此前2024年10月份发布的Claude 3.5 Sonnet (New)就是Claude 3.6 Sonnet 。此次应该是为了避免大家混淆,所以取名Claude 3.7 Sonnet。


支持的应用场景:基于大量知识的检索与获取(RAG),产品推荐,预测,精准营销,代码生成,质量控制,从图片中解析文本,智能计算机使用,内容生成。


模型特点:推理,文本生成,代码生成,富文本格式化,智能计算机使用。


以下是更详细的介绍,原文参考: https://www.datalearner.com/blog/1051740051841021 

Claude 3.7 Sonnet与其它模型对比参考: https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=32,36,37,35&modelInputString=513,512,511,501,495,492 


2025年2月25日,Anthropic 公司正式发布了 Claude 3.7 Sonnet 大模型,这一版本在多项能力上实现了显著提升,尤其是代码能力的增强,使其在编程领域更具竞争力。

一、Claude 3.7 Sonnet 大模型简介

Claude 3.7 Sonnet 是业界首个支持双重输出模式的大模型,既支持标准输出模式,也支持深度推理模式。其中,深度推理模式被称为 Claude 3.7 Sonnet with 64K extended thinking,最多支持 128K 长度的输出。这一特性使得模型在处理复杂问题时,能够提供更加详细的推理过程,帮助用户更好地理解模型的思考逻辑。

二、推理过程公开

Anthropic 决定在 Claude 3.7 Sonnet 中公开推理过程,旨在提升用户体验和信任,支持安全性研究。用户可以观察到模型的思维链条,从而更信任输出结果。同时,这为研究人员提供了研究模型行为的机会,有助于探讨扩展思维链条对模型性能的影响。然而,Anthropic 也指出,这一做法可能会带来滥用风险,未来可能会根据研究和反馈进行调整。

三、性能和评测效果

Claude 3.7 Sonnet 在代码和前端网页开发方面表现出色。与 Claude 3.5 Sonnet 相比,其编程水平有了显著提升。在 SWE-Bench 等现实场景的编程评测中,Claude 3.7 Sonnet 不使用推理模式也大幅优于其他模型。虽然在数学推理方面略逊于 OpenAI o1 和 DeepSeek-R1 等模型,但在常识推理和编程方面表现优异。

四、Claude Code 编程 Agent 系统

Anthropic 推出了 Claude Code 编程 Agent 系统,这是一款具备自主行动能力的编程工具,目前处于有限的研究预览阶段。Claude Code 能够搜索和阅读代码、编辑文件、编写和运行测试,还能将代码提交至 GitHub,甚至使用命令行工具。它在测试驱动开发、复杂问题调试和大规模重构方面表现出色,能够显著减少开发时间和工作量。

五、对用户开放及 API 接口

Claude 3.7 Sonnet 模型已在官网开放使用,免费用户和付费用户均可使用,但免费用户无法使用深度思考模式。此外,AWS 和 Google 等云服务也提供了 Claude 3.7 Sonnet 的 API 接口服务。API 接口价格与上一版本相同,输入每 100 万 tokens 3 美元,输出每 100 万 tokens 15 美元。

总之,Claude 3.7 Sonnet 的发布标志着 Anthropic 在大模型领域的又一次重要进步,其双重模式和编程能力的提升,使其在编程领域更具竞争力,为开发者提供了更强大的工具支持。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat