Qwen2.5-3B

Name: Qwen2.5-3B
Author: 阿里巴巴

基础大模型Qwen2.5

Qwen2.5-3B

发布时间: 2024-09-18更新于: 2024-09-21 11:23:261,227

在线体验GitHub Hugging Face Compare

模型参数

30亿

上下文长度

32K

中文支持

支持

推理能力

Qwen2.5-3B 是由阿里巴巴发布的 AI 模型，发布时间为 2024-09-18，定位为基础大模型，参数规模约为 30亿，上下文长度为 32K，模型文件大小约 6GB，采用 Tongyi Qianwen RESEARCH LICENSE AGREEMENT 许可，在 GSM8K 上取得 79.10 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen2.5-3B

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

32K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

暂无数据

发布时间

2024-09-18

模型文件大小

6GB

MoE架构

否

总参数 / 激活参数

30亿 / 不涉及

知识截止

暂无数据

Qwen2.5-3B

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Tongyi Qianwen RESEARCH LICENSE AGREEMENT- 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen2.5

Hugging Face

https://huggingface.co/Qwen/Qwen2.5-3B

在线体验

暂无在线体验地址

Qwen2.5-3B

官方介绍与博客

官方论文

Qwen2.5-LLM: Extending the boundary of LLMs

DataLearnerAI博客

暂无介绍博客

Qwen2.5-3B

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

Qwen2.5-3B

评测结果

Qwen2.5-3B 当前已收录的代表性评测结果包括 GSM8K（17 / 26，得分 79.10）、BBH（16 / 20，得分 56.30）、MBPP（24 / 28，得分 57.10）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总数

MMLU

65.60

63 / 65

BBH

56.30

16 / 20

MMLU Pro

34.60

123 / 126

GPQA Diamond

24.30

177 / 180

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

GSM8K

79.10

17 / 26

MATH

42.60

37 / 42

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

MBPP

57.10

24 / 28

HumanEval

42.10

34 / 39

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Qwen2.5-3B

发布机构

阿里巴巴

查看发布机构详情

Qwen2.5-3B

模型解读

Qwen2.5-3B是阿里巴巴开源的30亿参数规模的大语言模型。属于当前业界认为的可以在移动端运行的最高尺寸的大语言模型。该模型常规版本的文件大小为6GB，可以在手机端运行。该模型与阿里巴巴开源的其它2.5代模型最大的差异是开源协议不同。它的开源协议是Qwen Research协议，该开源协议是不允许商用的。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送