QW

Qwen2-1.5B

基础大模型Qwen2

Qwen2-1.5B

发布时间: 2024-06-07更新于: 2024-06-09 21:31:23724
模型参数
15亿
上下文长度
32K
中文支持
支持
推理能力

Qwen2-1.5B 是由 阿里巴巴 发布的 AI 模型,发布时间为 2024-06-07,定位为 基础大模型,参数规模约为 15亿,上下文长度为 32K,模型文件大小约 3.09GB,采用 Apache 2.0 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Qwen2-1.5B

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
32K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2024-06-07
模型文件大小
3.09GB
MoE架构
总参数 / 激活参数
15亿 / 不涉及
知识截止
暂无数据
Qwen2-1.5B

开源和体验地址

Qwen2-1.5B

官方介绍与博客

Qwen2-1.5B

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Qwen2-1.5B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Qwen2-1.5B

发布机构

Qwen2-1.5B

模型解读

阿里巴巴开源的15亿参数规模的大语言模型,是小规模参数语言模型中表现最强的一个。与其它小规模参数模型相比,该模型在不同评测结果上都取得了非常好的结果。下图是该模型与其它模型的对比结果:


DatasetsPhi-2Gemma-2BMiniCPMQwen1.5-1.8BQwen2-0.5BQwen2-1.5B
#Non-Emb Params2.5B2.0B2.4B1.3B0.35B1.3B
MMLU52.742.353.546.845.456.5
MMLU-Pro-15.9--14.721.8
Theorem QA----8.915.0
HumanEval47.622.050.020.122.031.1
MBPP55.029.247.318.022.037.4
GSM8K57.217.753.838.436.558.5
MATH3.511.810.210.110.721.7
BBH43.435.236.924.228.437.2
HellaSwag73.171.468.361.449.366.6
Winogrande74.466.8-60.356.866.2
ARC-C61.148.5-37.931.543.9
TruthfulQA44.533.1-39.439.745.9
C-Eval23.428.051.159.758.270.6
CMMLU24.2-51.157.855.170.3


DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码