DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表Claude Sonnet 3.7-64K Extended Thinking
CL

Claude Sonnet 3.7-64K Extended Thinking

推理大模型

Claude Sonnet 3.7-64K Extended Thinking

发布时间: 2025-02-25更新于: 2025-02-25 14:43:53784
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
128K
中文支持
支持
推理能力

Claude Sonnet 3.7-64K Extended Thinking 是由 Anthropic 发布的 AI 模型,发布时间为 2025-02-25,定位为 推理大模型,上下文长度为 128K,采用 不开源 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Claude Sonnet 3.7-64K Extended Thinking

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
128K tokens
最大输出长度
暂无数据
模型类型
推理大模型
发布时间
2025-02-25
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
Claude Sonnet 3.7-64K Extended Thinking

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
Claude Sonnet 3.7-64K Extended Thinking

官方介绍与博客

官方论文
Claude 3.7 Sonnet and Claude Code
DataLearnerAI博客
Anthropic发布Claude 3.7 Sonnet大模型,全球最强编程模型再次进步。业界第一个既支持标准输出也支持扩展思考推理双重模式的单一大模型,评测结果超DeepSeek R1,低于Grok3-Beta Reasoning,免费用户可用
Claude Sonnet 3.7-64K Extended Thinking

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Claude Sonnet 3.7-64K Extended Thinking

评测结果

Claude Sonnet 3.7-64K Extended Thinking 当前已收录的代表性评测结果包括 GPQA Diamond(39 / 166,得分 84.80)、MATH-500(19 / 43,得分 96.20)、AIME 2024(28 / 62,得分 80)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规

综合评估

共 1 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
关闭
84.80
39 / 166

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
MATH-500
关闭
96.20
19 / 43
AIME 2024
关闭
80
28 / 62
查看评测深度分析与其他模型对比
Claude Sonnet 3.7-64K Extended Thinking

发布机构

Anthropic
Anthropic
查看发布机构详情
Claude Sonnet 3.7-64K Extended Thinking

模型解读

Claude Sonnet 3.7-64K Extended Thinking是Anthropic发布的第四代大语言模型,是Claude 3.7 Sonnet开启推理模式之后的大模型。


以下是更详细的介绍,原文参考: https://www.datalearner.com/blog/1051740051841021 

Claude 3.7 Sonnet与其它模型对比参考: https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=32,36,37,35&modelInputString=513,512,511,501,495,492 


2025年2月25日,Anthropic 公司正式发布了 Claude 3.7 Sonnet 大模型,这一版本在多项能力上实现了显著提升,尤其是代码能力的增强,使其在编程领域更具竞争力。

一、Claude 3.7 Sonnet 大模型简介

Claude 3.7 Sonnet 是业界首个支持双重输出模式的大模型,既支持标准输出模式,也支持深度推理模式。其中,深度推理模式被称为 Claude 3.7 Sonnet with 64K extended thinking,最多支持 128K 长度的输出。这一特性使得模型在处理复杂问题时,能够提供更加详细的推理过程,帮助用户更好地理解模型的思考逻辑。

二、推理过程公开

Anthropic 决定在 Claude 3.7 Sonnet 中公开推理过程,旨在提升用户体验和信任,支持安全性研究。用户可以观察到模型的思维链条,从而更信任输出结果。同时,这为研究人员提供了研究模型行为的机会,有助于探讨扩展思维链条对模型性能的影响。然而,Anthropic 也指出,这一做法可能会带来滥用风险,未来可能会根据研究和反馈进行调整。

三、性能和评测效果

Claude 3.7 Sonnet 在代码和前端网页开发方面表现出色。与 Claude 3.5 Sonnet 相比,其编程水平有了显著提升。在 SWE-Bench 等现实场景的编程评测中,Claude 3.7 Sonnet 不使用推理模式也大幅优于其他模型。虽然在数学推理方面略逊于 OpenAI o1 和 DeepSeek-R1 等模型,但在常识推理和编程方面表现优异。

四、Claude Code 编程 Agent 系统

Anthropic 推出了 Claude Code 编程 Agent 系统,这是一款具备自主行动能力的编程工具,目前处于有限的研究预览阶段。Claude Code 能够搜索和阅读代码、编辑文件、编写和运行测试,还能将代码提交至 GitHub,甚至使用命令行工具。它在测试驱动开发、复杂问题调试和大规模重构方面表现出色,能够显著减少开发时间和工作量。

五、对用户开放及 API 接口

Claude 3.7 Sonnet 模型已在官网开放使用,免费用户和付费用户均可使用,但免费用户无法使用深度思考模式。此外,AWS 和 Google 等云服务也提供了 Claude 3.7 Sonnet 的 API 接口服务。API 接口价格与上一版本相同,输入每 100 万 tokens 3 美元,输出每 100 万 tokens 15 美元。

总之,Claude 3.7 Sonnet 的发布标志着 Anthropic 在大模型领域的又一次重要进步,其双重模式和编程能力的提升,使其在编程领域更具竞争力,为开发者提供了更强大的工具支持。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码