Anthropic发布Claude3.5-Sonnet模型,超过Claude3系列所有模型的能力,并且支持多模态!
Claude系列模型是Anthropic发布的大模型,一直被认为是最接近GPT-4系列的大模型。2024年3月份,Anthropic发布了Claude3系列,从各方的使用情况看,都接近甚至超过了GPT-4。时隔三个月,Anthropic再次发布全新3.5版本的Claude3.5系列。本次首先发布的是Claude3.5-Sonnet版本。已经支持免费使用。

Claude3.5-Sonnet模型简介
从Claude3开始,Anthropic的模型就分为三个不同的版本。其中,Claude3-Opus是最强最大但是速度也是最慢的版本,Claude3-Haiku是最小最快的模型,而Claude3-Sonnet则是介于二者之间的模型,即速度与性能相对均衡的模型。
关于Claude3系列模型的简介和对比,可以参考此前DataLearnerAI的博客介绍:https://www.datalearner.com/blog/1051709652088982
此次发布的Claude3.5-Sonnet是Claude3.5系列模型中第一个发布的版本,官方披露的信息,这个模型比Claude3-Opus更强大,而且是多模态大模型,速度更快。
Claude3.5-Sonnet兼具速度和性能。按照官方披露的数据,Claude3.5-Sonnet相比第三代最强模型Claude3-Opus,性能更强,但是速度是其两倍!Claude3.5-Sonnet在捕获细节、幽默、复杂指令等方面有了明显的提升,可以生成更加高质量、自然的人类容易阅读的文本。
Claude3.5-Sonnet的各方面评测大幅提升
Anthropic发布了Claude3.5-Sonnet与前代模型和大当前最强大模型的评测结果对比。即使与上一代最强的Claude3模型Claude3-Opus相比,也有明显优势。如下图所示:

可以看到,相比Claude3-Opus,Claude3.5-Sonnet的文本理解能力(MMLU)、数学推理(Math/GSM8K)、推理能力(GPQA)都有大幅提升。甚至在编程方面(HumanEval)都有了10%!的提升!,这些评测数据与GPT-4o比也基本上都要更好。
而根据DataLearnerAI收集的大模型评测结果数据看,除了MMLU,Claude3-Sonnet都是最强的。当之无愧的新王者!

而在编程评测(HumanEval)评测上,Claude3.5-Sonnet则是超过了此前最强的GPT-4o模型和一众编程大模型,全球第一。

可以说,提升明显,强的可怕!
Claude3.5-Sonnet是一个多模态大模型
除了上述常规的升级外,此次Claude3.5-Sonnet模型另一个令人惊喜的升级是支持多模态的输入。图像的理解能力也比Claude3-Opus大幅提升!
Claude 3.5 Sonnet 是我们迄今为止最强大的视觉模型,在标准视觉基准测试中超过了 Claude 3 Opus。在解读图表等需要视觉推理的任务中,这些阶跃式的改进最为明显。Claude 3.5 Sonnet 还能从不完美的图像中准确地转录文本—这是零售、物流和金融服务的核心能力,在这些领域,人工智能可能会从图像、图形或插图中获得比单纯从文本中获得更多的洞察力。
下图是官网的一个演示视频截图:

在业界的多模态大模型评测基准上,Claude3.5-Sonnet表现也非常不错。

可以说是超过了GPT-4o!
Anthropic发布大模型交互新方式——Artifacts
Anthropic此次发布的东西除了Claude3.5-Sonnet外,还在官网发布了一个新的大模型交互系统:Artifacts,即当你使用Claude模型生成代码、文本、网站设计的时候,Artifacts会出现一个动态工作区,用户可以实时查看、编辑和构建Claude生成的结果!Anthropic认为,这可能是未来AI嵌入团队工作的一种形式!
我们也尝试了这个特性和Claude3.5-Sonnet的能力,我们做了两个尝试,一个是生成DataLearnerAI的网站落地页。一个是生成LOGO。
生成DataLeanerAI落地页:

生成LOGO,这里我们还让它修改了原方案,对我们修改的意图理解非常准确!

一个是颜色变了,一个是文字变小了,在圆圈范围内。从这个测试看,一旦Artifacts能力成熟,未来基于大模型的工作空间可能会颠覆当前很多软件,包括Photoshop、剪映,程序员开发工具IDE等!影响应该很大!
Claude3.5-Sonnet总结
本次Anthropic发布的Claude3.5-Sonnet模型已经可以在官网使用。免费用户也能使用,付费用户则额度更高。而接口的费用与Claude3-Sonnet一样,输入3美元/100万tokens,输出是15美元/100万tokens,比GPT-4-Turbo价格略低一丢丢。但是这个模型显然吸引力非常高。
这里有一个值得注意的是,OpenAI最新的GPT-4o模型进化到多模态之后速度也提升了很多。而Anthropic发布的Claude3.5-Sonnet模型多模态提升了之后速度也提升了2倍。说明业界至少最新的技术可能已经掌握了多模态大模型推理加速的诀窍。未来更强更快的多模态模型可能很快就会爆发!
关于Claude3.5-Sonnet模型的技术信息可以关注DataLearnerAI模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/claude-3_5-sonnet ,未来有新的信息我们会披露。
此外,Anthropic官方说明Claude3.5-Sonnet是他们第一个3.5代模型,今年晚些时候,他们会继续发布Claude3.5-Haiku和Claude3.5-Opus,真是十分值得期待!
欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
