Claude3-Opus
Claude3-Opus 是由 Anthropic 发布的 AI 模型,发布时间为 2024-03-04,定位为 多模态大模型,参数规模约为 0.0B,上下文长度为 200K,采用 不开源 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
Claude3-Opus 当前已收录的代表性评测结果包括 GSM8K(8 / 26,得分 95)、HellaSwag(1 / 3,得分 95.40)、MMLU(26 / 64,得分 86.80)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
Claude3-Opus是Anthropic公司发布的第三代多模态大语言模型。第三代的Claude-3模型包含3个版本,这里说的Claude3-Opus是其中能力最强的模型。各项评测人任务结果都非常好,甚至超过了GPT-4。
在多模态方面,Claude3-Opus也有强大的能力。

Claude2最受诟病的就是无效的拒绝回答。由于Anthropic在对齐方面做了严格的工作,导致Claude2.1经常出现拒绝回答的情况。在Claude3-Opus上。Anthropic做了改进,在内部测试中,Claude2.1错误地拒绝比例大概在26%左右,而Claude3-Opus上这个比例下降到了11%,进步明显!

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
