DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
  1. 首页/
  2. 博客列表/
  3. 博客详情

Anthropic发布Claude3.5-Sonnet模型,超过Claude3系列所有模型的能力,并且支持多模态!

2024/06/20 23:36:26
1,279 阅读
AnthropicClaudeClaude3Claude3.5-Sonnet

Claude系列模型是Anthropic发布的大模型,一直被认为是最接近GPT-4系列的大模型。2024年3月份,Anthropic发布了Claude3系列,从各方的使用情况看,都接近甚至超过了GPT-4。时隔三个月,Anthropic再次发布全新3.5版本的Claude3.5系列。本次首先发布的是Claude3.5-Sonnet版本。已经支持免费使用。

  • Claude3.5-Sonnet模型简介
  • Claude3.5-Sonnet的各方面评测大幅提升
  • Claude3.5-Sonnet是一个多模态大模型
  • Anthropic发布大模型交互新方式——Artifacts
  • Claude3.5-Sonnet总结

Claude3.5-Sonnet模型简介

从Claude3开始,Anthropic的模型就分为三个不同的版本。其中,Claude3-Opus是最强最大但是速度也是最慢的版本,Claude3-Haiku是最小最快的模型,而Claude3-Sonnet则是介于二者之间的模型,即速度与性能相对均衡的模型。

关于Claude3系列模型的简介和对比,可以参考此前DataLearnerAI的博客介绍:https://www.datalearner.com/blog/1051709652088982

此次发布的Claude3.5-Sonnet是Claude3.5系列模型中第一个发布的版本,官方披露的信息,这个模型比Claude3-Opus更强大,而且是多模态大模型,速度更快。

Claude3.5-Sonnet兼具速度和性能。按照官方披露的数据,Claude3.5-Sonnet相比第三代最强模型Claude3-Opus,性能更强,但是速度是其两倍!Claude3.5-Sonnet在捕获细节、幽默、复杂指令等方面有了明显的提升,可以生成更加高质量、自然的人类容易阅读的文本。

Claude3.5-Sonnet的各方面评测大幅提升

Anthropic发布了Claude3.5-Sonnet与前代模型和大当前最强大模型的评测结果对比。即使与上一代最强的Claude3模型Claude3-Opus相比,也有明显优势。如下图所示:

可以看到,相比Claude3-Opus,Claude3.5-Sonnet的文本理解能力(MMLU)、数学推理(Math/GSM8K)、推理能力(GPQA)都有大幅提升。甚至在编程方面(HumanEval)都有了10%!的提升!,这些评测数据与GPT-4o比也基本上都要更好。

而根据DataLearnerAI收集的大模型评测结果数据看,除了MMLU,Claude3-Sonnet都是最强的。当之无愧的新王者!

Claude3.5-Sonnet评测结果
Claude3.5-Sonnet评测结果
数据来源:https://www.datalearner.com/ai-models/leaderboard/datalearner-llm-leaderboard

而在编程评测(HumanEval)评测上,Claude3.5-Sonnet则是超过了此前最强的GPT-4o模型和一众编程大模型,全球第一。

数据来源:https://www.datalearner.com/ai-models/leaderboard/datalearner-llm-coding-leaderboard

可以说,提升明显,强的可怕!

Claude3.5-Sonnet是一个多模态大模型

除了上述常规的升级外,此次Claude3.5-Sonnet模型另一个令人惊喜的升级是支持多模态的输入。图像的理解能力也比Claude3-Opus大幅提升!

Claude 3.5 Sonnet 是我们迄今为止最强大的视觉模型,在标准视觉基准测试中超过了 Claude 3 Opus。在解读图表等需要视觉推理的任务中,这些阶跃式的改进最为明显。Claude 3.5 Sonnet 还能从不完美的图像中准确地转录文本--这是零售、物流和金融服务的核心能力,在这些领域,人工智能可能会从图像、图形或插图中获得比单纯从文本中获得更多的洞察力。

下图是官网的一个演示视频截图:

在业界的多模态大模型评测基准上,Claude3.5-Sonnet表现也非常不错。

可以说是超过了GPT-4o!

Anthropic发布大模型交互新方式——Artifacts

Anthropic此次发布的东西除了Claude3.5-Sonnet外,还在官网发布了一个新的大模型交互系统:Artifacts,即当你使用Claude模型生成代码、文本、网站设计的时候,Artifacts会出现一个动态工作区,用户可以实时查看、编辑和构建Claude生成的结果!Anthropic认为,这可能是未来AI嵌入团队工作的一种形式!

我们也尝试了这个特性和Claude3.5-Sonnet的能力,我们做了两个尝试,一个是生成DataLearnerAI的网站落地页。一个是生成LOGO。

生成DataLeanerAI落地页:

生成LOGO,这里我们还让它修改了原方案,对我们修改的意图理解非常准确!

一个是颜色变了,一个是文字变小了,在圆圈范围内。从这个测试看,一旦Artifacts能力成熟,未来基于大模型的工作空间可能会颠覆当前很多软件,包括Photoshop、剪映,程序员开发工具IDE等!影响应该很大!

Claude3.5-Sonnet总结

本次Anthropic发布的Claude3.5-Sonnet模型已经可以在官网使用。免费用户也能使用,付费用户则额度更高。而接口的费用与Claude3-Sonnet一样,输入3美元/100万tokens,输出是15美元/100万tokens,比GPT-4-Turbo价格略低一丢丢。但是这个模型显然吸引力非常高。

这里有一个值得注意的是,OpenAI最新的GPT-4o模型进化到多模态之后速度也提升了很多。而Anthropic发布的Claude3.5-Sonnet模型多模态提升了之后速度也提升了2倍。说明业界至少最新的技术可能已经掌握了多模态大模型推理加速的诀窍。未来更强更快的多模态模型可能很快就会爆发!

关于Claude3.5-Sonnet模型的技术信息可以关注DataLearnerAI模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/claude-3_5-sonnet ,未来有新的信息我们会披露。

此外,Anthropic官方说明Claude3.5-Sonnet是他们第一个3.5代模型,今年晚些时候,他们会继续发布Claude3.5-Haiku和Claude3.5-Opus,真是十分值得期待!

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

  • Anthropic 发布 Cowork:从 Claude Code 的发展历史看 Cowork 的能力与定位,它可能成为普通人的下一代桌面 AI 助手吗?
  • Anthropic发布Claude Haiku 4.5:一个不可忽视的低成本模型,1/3的价格,1.5倍的速度,但是有Claude Sonnet 4的水平!
  • 大模型可以运营自动售货机吗?Anthropic的Project Vend实验:Claude能成功经营一家小店吗?答案是亏损严重还会免费赠送商品!
  • Anthropic发布Claude4,全球最强编程大模型,大幅提升AI Agent系统所需的各项能力,最长可以7小时连续工作,持续工作、工具使用、记忆使用方面大幅提升
  • 大模型的多语言能力来自哪里?大模型是否有自己的内部语言?在英文数据集上学习到的知识可以用中文表达出来吗?
  • Anthropic的Claude 4即将发布前新功能曝光:带有Thinking模式,且可以看到推理过程
  • Anthropic发布Claude 3.7 Sonnet大模型,全球最强编程模型再次进步。业界第一个既支持标准输出也支持扩展思考推理双重模式的单一大模型,评测结果超DeepSeek R1,低于Grok3-Beta Reasoning,免费用户可用
  • AI Agent进展再进一步!Anthropic发布大模型上下文连接访问协议MCP:让任何资源快速变成大模型的工具,突破大模型的能力边界!

热门博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8H5文件简介和使用