baichuan3
基础大模型baichuan3
模型参数
未披露
上下文长度
8K
中文支持
支持
推理能力
baichuan3 是由 百川智能 发布的 AI 模型,发布时间为 2024-01-29,定位为 基础大模型,上下文长度为 8K,模型文件大小约 0GB,采用 不开源 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
baichuan3
模型基本信息
推理过程
不支持
思考模式
不支持思考模式
上下文长度
8K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2024-01-29
模型文件大小
0GB
MoE架构
否
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
baichuan3
开源和体验地址
代码开源状态
不开源
预训练权重开源
不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
baichuan3
官方介绍与博客
DataLearnerAI博客
暂无介绍博客
baichuan3
API接口信息
接口速度
暂无数据
暂无公开的 API 定价信息。
baichuan3
评测结果
当前尚无可展示的评测数据。
和其他模型对比
暂时没有为该模型整理的相关对比页面。
想自定义其他组合?打开对比工具
baichuan3
发布机构
百川智能
查看发布机构详情 baichuan3
模型解读
百川智能发布的第三代大语言模型,与此前两代百川模型最大的不同是这个版本的模型完全闭源。官方只公布了内部测试的成绩结果,没有其它额外信息。
官方公布的baichuan3模型与其它模型在文本理解方面的评测对比结果:
| 模型 | CMMLU | GAOKAO | MMLU | AGI-Eval | BBH | ARC-E | ARC-C |
|---|---|---|---|---|---|---|---|
| Baichuan 3 | 78.12 | 79.42 | 81.69 | 73.16 | 84.56 | 86.11 | 85.58 |
| GPT-4 | 70.33 | 65.99 | 86.40 | 63.42 | 86.70 | 95.40 | 93.60 |
| GPT-3.5 | 54.06 | 46.90 | 68.54 | 45.93 | 70.10 | 88.90 | 83.70 |
Baichuan3在数学逻辑推理和代码生成方面的评测结果:
| 模型 | GSM8K | MATH | Human Eval | MBPP | Crux-l | Crux-O |
|---|---|---|---|---|---|---|
| Baichuan 3 | 88.17 | 49.20 | 70.12 | 68.20 | 57.88 | 58.38 |
| GPT-4 | 92.00 | 52.90 | 67.00 | 63.60 | 69.80 | 68.70 |
| GPT-3.5 | 57.10 | 13.96 | 52.44 | 61.40 | 49.00 | 49.40 |
根据DataLearnerAI收集的大模型评测数据,Baichuan3的文本理解、数学推理上基本上仅次于GPT-4和Google Gemini Ultra,排名第三,比前段时间智谱AI发布的GLM4略高。

数据来源: https://www.datalearner.com/ai-models/llm-evaluation
在编程领域的得分比GLM4略低:

数据来源: https://www.datalearner.com/ai-models/llm-coding-evaluation
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
