Qwen1.5-32B

Name: Qwen1.5-32B
Author: 阿里巴巴

基础大模型Qwen1.5

Qwen1.5-32B

发布时间: 2024-04-03更新于: 2024-04-06 20:14:19819

在线体验GitHub Hugging Face Compare

模型参数

320亿

上下文长度

32K

中文支持

支持

推理能力

Qwen1.5-32B 是由阿里巴巴发布的 AI 模型，发布时间为 2024-04-03，定位为基础大模型，参数规模约为 320亿，上下文长度为 32K，模型文件大小约 65.79GB，采用 Tongyi Qianwen RESEARCH LICENSE AGREEMENT 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen1.5-32B

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

32K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

暂无数据

发布时间

2024-04-03

模型文件大小

65.79GB

MoE架构

否

总参数 / 激活参数

320亿 / 不涉及

知识截止

暂无数据

Qwen1.5-32B

开源和体验地址

代码开源状态

Tongyi Qianwen RESEARCH LICENSE AGREEMENT

预训练权重开源

Tongyi Qianwen RESEARCH LICENSE AGREEMENT- 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen1.5

Hugging Face

https://huggingface.co/Qwen/Qwen1.5-32B

在线体验

暂无在线体验地址

Qwen1.5-32B

官方介绍与博客

官方论文

Qwen1.5-32B: Fitting the Capstone of the Qwen1.5 Language Model Series

DataLearnerAI博客

暂无介绍博客

Qwen1.5-32B

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

Qwen1.5-32B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Qwen1.5-32B

发布机构

阿里巴巴

查看发布机构详情

Qwen1.5-32B

模型解读

近期，Qwen团队发布了Qwen1.5语言模型系列的最新成员——Qwen1.5-32B及其聊天版本Qwen1.5-32B-Chat。本模型参数320亿，是此前发布的通义千问系列最强模型Qwen1.5-72B模型参数的一半，但是性能非常接近。因此，是一个值得关注使用的模型。官方发布的Qwen1.5-32B包含5个版本：

Qwen1.5-32B模型版本	模型介绍	HuggingFace下载地址
Qwen1.5-32B	预训练基座模型，没有任何对齐	https://huggingface.co/Qwen/Qwen1.5-32B
Qwen1.5-32B-Chat	聊天优化版本模型	https://huggingface.co/Qwen/Qwen1.5-32B-Chat
Qwen1.5-32B-Chat-AWQ	AWQ量化版本	https://huggingface.co/Qwen/Qwen1.5-32B-Chat-AWQ
Qwen1.5-32B-Chat-GGUF	GGUF量化版本	https://huggingface.co/Qwen/Qwen1.5-32B-Chat-GGUF
Qwen1.5-32B-Chat-GPTQ-Int4	Int4量化版本	https://huggingface.co/Qwen/Qwen1.5-32B-Chat-GPTQ-Int4

Qwen1.5-32B模型架构

Qwen1.5-32B模型是一个拥有320亿参数的语言模型，它在保持与Qwen1.5系列其他模型相似的架构基础上，引入了分组查询注意力（Grouped Query Attention, GQA）技术，以期在模型服务中实现更高效的推理性能。该模型的开发过程中，Qwen团队不仅关注基础模型的性能，同时也在后训练技术，特别是强化学习人类反馈（Reinforcement Learning from Human Feedback, RLHF）方面取得了进展，以提升Qwen1.5-32B-Chat的对话能力。

Qwen1.5-32B性能评估

在性能评估方面，Qwen1.5-32B模型在多个基准测试中展现出了竞争力。与72B参数的模型相比，尽管性能略有下降，但在大多数任务中仍然超过了其他30B参数的模型，如Llama2-34B和Mixtral-8x7B。具体来看，Qwen1.5-32B在MMLU、GSM8K、HumanEval和BBH等任务上的表现均十分出色。在DataLearnerAI收集的全球主流模型评测结果上，Qwen1.5-32B接近此前发布的DBRX模型（ https://www.datalearner.com/ai-models/pretrained-models/DBRX-Instruct ），这是一个1320亿参数的MoE模型：

数据来源： https://www.datalearner.com/ai-models/llm-evaluation （按照MMLU从高到低排序）

对于聊天模型，Qwen1.5-32B-Chat在MT-Bench和Alpaca-Eval 2.0上的测试结果显示，其平均得分超过8分，与72B参数的Qwen1.5-72B-Chat相比差距相对较小。这表明，对于需要更高效、成本更低的聊天应用解决方案的用户来说，32B模型是一个可行的选择。

在多语言能力方面，Qwen1.5-32B在包括阿拉伯语、西班牙语、法语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语和印尼语在内的12种语言上进行了测试。测试内容涵盖了考试、理解、数学和翻译等多个领域，结果显示该模型具备相当不错的多语言处理能力，虽然略逊于72B模型，但整体表现仍然令人满意。

Qwen1.5-32B长文本处理能力

在长文本处理方面，Qwen1.5-32B在“大海捞针”（Needle in a Haystack）的评估中表现出色，能够在32K tokens的上下文中实现顶级性能。这一点对于需要处理大量文本数据的应用场景尤为重要。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送