Qwen2.5-72B

Name: Qwen2.5-72B
Price: 0.004 CNY
Availability: InStock
Author: 阿里巴巴

基础大模型Qwen2.5

Qwen2.5-72B

发布时间: 2024-09-18更新于: 2024-09-21 11:25:431,669

在线体验GitHub Hugging Face Compare

模型参数

727亿

上下文长度

128K

中文支持

支持

推理能力

Qwen2.5-72B 是由阿里巴巴发布的 AI 模型，发布时间为 2024-09-18，定位为基础大模型，参数规模约为 727亿，上下文长度为 128K，模型文件大小约 144GB，采用 Qwen License 许可，在 GSM8K 上取得 91.50 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen2.5-72B

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

128K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

暂无数据

发布时间

2024-09-18

模型文件大小

144GB

MoE架构

否

总参数 / 激活参数

727亿 / 不涉及

知识截止

暂无数据

Qwen2.5-72B

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Qwen License- 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen2.5

Hugging Face

https://huggingface.co/Qwen/Qwen2.5-72B

在线体验

暂无在线体验地址

Qwen2.5-72B

官方介绍与博客

官方论文

Qwen2.5-LLM: Extending the boundary of LLMs

DataLearnerAI博客

暂无介绍博客

Qwen2.5-72B

API接口信息

接口速度

暂无数据

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	¥0.0040/ 1K	¥0.012/ 1K

Qwen2.5-72B

评测结果

Qwen2.5-72B 当前已收录的代表性评测结果包括 TruthfulQA（1 / 4，得分 60.40）、MBPP（7 / 28，得分 84.70）、GSM8K（11 / 26，得分 91.50）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总数

BBH

86.30

11 / 21

MMLU

86.10

32 / 66

MMLU Pro

58.10

113 / 132

GPQA Diamond

45.90

167 / 187

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

GSM8K

91.50

11 / 26

MATH

62.10

29 / 42

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

MBPP

84.70

7 / 28

HumanEval

59.10

30 / 39

真实性评估

共 1 项评测

评测名称 / 模式

得分

排名/总数

TruthfulQA

60.40

1 / 4

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Qwen2.5-72B

发布机构

阿里巴巴

查看发布机构详情

Qwen2.5-72B

模型解读

阿里开源的Qwen2.5系列模型中参数量最大的一个版本，720亿参数规模。其评测效果超过了MetaAI开源的同等参数规模的Llama-3-70B。产品月活低于1亿的商业应用是免费的。

720亿参数规模的Qwen2.5包含了多个版本，除了基座版本外，官方也开源了量化版本以及不同的指令微调版本，其结果如下：

Qwen2.5-72B版本	版本简介	HuggingFace开源地址
Qwen2.5-72B	720亿参数规模的基座版本	https://huggingface.co/Qwen/Qwen2.5-72B
Qwen2.5-72B-Instruct	指令微调版本	https://huggingface.co/Qwen/Qwen2.5-72B-Instruct
Qwen2.5-72B-Instruct-AWQ	AWQ的4bit量化版本的指令微调Qwen2.5	https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-AWQ
Qwen2.5-72B-Instruct-GPTQ	GPTQ量化版本的指令微调Qwen2.5，包含不同的量化水平	Int8： https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-GPTQ-Int8 Int4： https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-GPTQ-Int4
Qwen2.5-72B-Instruct-GGUF	GGUF量化格式版本	https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-GGUF

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送