Qw

Qwen2-1.5B

基础大模型

Qwen2-1.5B

发布时间: 2024-06-07

GitHub Hugging Face 在线体验

模型参数（Parameters）

15.0

最高上下文长度（Context Length）

32K

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

32K tokens

最长输出结果

暂无数据

模型类型

基础大模型

发布时间

2024-06-07

模型预文件大小

3.09GB

开源和体验地址

代码开源状态

预训练权重开源

Apache 2.0 - 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen2

Hugging Face

https://huggingface.co/Qwen/Qwen2-1.5B

在线体验

https://huggingface.co/spaces/Qwen/Qwen2-1.5b-instruct-demo

官方介绍与博客

官方论文

Hello Qwen2

DataLearnerAI博客

阿里巴巴开源第二代大语言模型Qwen2系列，最高参数规模700亿，评测结果位列开源模型第一，超过了Meta开源的Llama3-70B！

API接口信息

接口速度（满分5分）

暂无数据

接口价格

输入价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输出价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding（向量）

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding（向量）

输出不支持

Qwen2-1.5B模型在各大评测榜单的评分

评测基准名称 / 模式

评测类型

评测结果

发布机构

阿里巴巴

查看发布机构详情

模型介绍

阿里巴巴开源的15亿参数规模的大语言模型，是小规模参数语言模型中表现最强的一个。与其它小规模参数模型相比，该模型在不同评测结果上都取得了非常好的结果。下图是该模型与其它模型的对比结果：

Datasets	Phi-2	Gemma-2B	MiniCPM	Qwen1.5-1.8B	Qwen2-0.5B	Qwen2-1.5B
#Non-Emb Params	2.5B	2.0B	2.4B	1.3B	0.35B	1.3B
MMLU	52.7	42.3	53.5	46.8	45.4	56.5
MMLU-Pro	-	15.9	-	-	14.7	21.8
Theorem QA	-	-	-	-	8.9	15.0
HumanEval	47.6	22.0	50.0	20.1	22.0	31.1
MBPP	55.0	29.2	47.3	18.0	22.0	37.4
GSM8K	57.2	17.7	53.8	38.4	36.5	58.5
MATH	3.5	11.8	10.2	10.1	10.7	21.7
BBH	43.4	35.2	36.9	24.2	28.4	37.2
HellaSwag	73.1	71.4	68.3	61.4	49.3	66.6
Winogrande	74.4	66.8	-	60.3	56.8	66.2
ARC-C	61.1	48.5	-	37.9	31.5	43.9
TruthfulQA	44.5	33.1	-	39.4	39.7	45.9
C-Eval	23.4	28.0	51.1	59.7	58.2	70.6
CMMLU	24.2	-	51.1	57.8	55.1	70.3

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯

DataLearnerAI WeChat