baichuan3

Name: baichuan3
Author: 百川智能

基础大模型

baichuan3

发布时间: 2024-01-29更新于: 2024-01-30 10:25:37.350631

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

中文支持

支持

推理能力

baichuan3 是由百川智能发布的 AI 模型，发布时间为 2024-01-29，定位为基础大模型，上下文长度为 8K，模型文件大小约 0GB，采用不开源许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

baichuan3

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

8K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

暂无数据

发布时间

2024-01-29

模型文件大小

0GB

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

baichuan3

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

暂无在线体验地址

baichuan3

官方介绍与博客

官方论文

百川智能公众号：百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4

DataLearnerAI博客

暂无介绍博客

baichuan3

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

baichuan3

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

baichuan3

发布机构

百川智能

查看发布机构详情

baichuan3

模型解读

百川智能发布的第三代大语言模型，与此前两代百川模型最大的不同是这个版本的模型完全闭源。官方只公布了内部测试的成绩结果，没有其它额外信息。

官方公布的baichuan3模型与其它模型在文本理解方面的评测对比结果：

模型	CMMLU	GAOKAO	MMLU	AGI-Eval	BBH	ARC-E	ARC-C
Baichuan 3	78.12	79.42	81.69	73.16	84.56	86.11	85.58
GPT-4	70.33	65.99	86.40	63.42	86.70	95.40	93.60
GPT-3.5	54.06	46.90	68.54	45.93	70.10	88.90	83.70

Baichuan3在数学逻辑推理和代码生成方面的评测结果：

模型	GSM8K	MATH	Human Eval	MBPP	Crux-l	Crux-O
Baichuan 3	88.17	49.20	70.12	68.20	57.88	58.38
GPT-4	92.00	52.90	67.00	63.60	69.80	68.70
GPT-3.5	57.10	13.96	52.44	61.40	49.00	49.40

根据DataLearnerAI收集的大模型评测数据，Baichuan3的文本理解、数学推理上基本上仅次于GPT-4和Google Gemini Ultra，排名第三，比前段时间智谱AI发布的GLM4略高。

数据来源： https://www.datalearner.com/ai-models/llm-evaluation

在编程领域的得分比GLM4略低：

数据来源： https://www.datalearner.com/ai-models/llm-coding-evaluation

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送