Qwen3-8B

Name: Qwen3-8B
Price: 0.0005 CNY
Availability: InStock
Author: 阿里巴巴

推理大模型Qwen3

Qwen3-8B

发布时间: 2025-04-28更新于: 2026-07-17 23:18:30.0163,626

在线体验 GitHub Hugging Face Compare

模型参数

80亿

上下文长度

128K

中文支持

支持

推理能力

Qwen3-8B 是阿里巴巴于 2025-04-28 发布的推理大模型。支持文本输入和文本输出，上下文窗口为 128K，主要能力包括推理大模型、多语言。页面已收录官方资料、API 定价、公开评测，便于核对规格和使用成本。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen3-8B

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

128K tokens

最大输出长度

126K tokens

模型类型

推理大模型

输入/输出模态

文本 → 文本

发布时间

2025-04-28

模型文件大小

16GB

MoE架构

否

总参数 / 激活参数

80亿 / 不涉及

知识截止

暂无数据

Qwen3-8B

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen3

Hugging Face

https://huggingface.co/Qwen/Qwen3-8B

在线体验

https://chat.qwen.ai/

Qwen3-8B

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

重磅！阿里开源第三代千问大模型：Qwen3系列，最小仅6亿参数规模，最大2350亿参数规模大模型！

Qwen3-8B

API接口信息

接口速度

4/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	¥0.0005/ 1K	¥0.0020/ 1K

Qwen3-8B

评测结果

Qwen3-8B 当前已收录的代表性评测结果包括 MATH-500（11 / 44，得分 97.40）、GPQA（5 / 15，得分 62）、AIME 2024（30 / 62，得分 79.40）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总数

MMLU Pro

72.50

89 / 132

GPQA Diamond

142 / 187

GPQA Diamond

39.30

173 / 187

GPQA

5 / 15

数学推理

共 6 项评测

评测名称 / 模式

得分

排名/总数

MATH-500

97.40

11 / 44

MATH-500

87.40

40 / 44

AIME 2024

79.40

30 / 62

AIME 2024

35 / 62

AIME2025

67.30

77 / 107

AIME2025

20.90

105 / 107

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

61.80

69 / 123

LiveCodeBench

57.50

73 / 123

写作和创作

共 2 项评测

评测名称 / 模式

得分

排名/总数

Creative Writing

21 / 23

Creative Writing

64.50

23 / 23

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Qwen3-8B

发布机构

阿里巴巴

查看发布机构详情

Qwen3-8B

模型解读

Qwen3-8B是阿里开源的80亿参数规模的大模型，是第三代千问大模型。

Qwen3-8B

常见问题

Qwen3-8B 是什么模型？

Qwen3-8B 支持哪些输入和输出模态？

当前官方资料记录其支持文本输入，并生成文本输出。

Qwen3-8B 的上下文窗口和最大输出是多少？

上下文窗口为 128K，最大输出为 126K。未公开或无法确认的规格不做推测。

Qwen3-8B 适合哪些任务？

根据已收录的官方能力标签，它适合推理大模型、多语言相关任务；实际效果应结合具体工作流验证。

Qwen3-8B 是否提供 API，价格如何查看？

页面已收录阿里巴巴的 2 条定价规则。价格可能随地域、上下文档位、缓存和时间变化，应以页面价格表及官方计费页为准。

Qwen3-8B 是否开源？

代码与模型权重按 Apache 2.0 记录；使用前仍应核对官方许可原文。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送