Qwen3-4B-Thinking-2507

Name: Qwen3-4B-Thinking-2507
Price: 0.11 USD
Availability: InStock
Author: 阿里巴巴

聊天大模型Qwen3

发布时间: 2025-08-06更新于: 2025-08-07 10:45:36970

在线体验 GitHub Hugging Face Compare

模型参数

40亿

上下文长度

256K

中文支持

支持

推理能力

Qwen3-4B-Thinking-2507 是由阿里巴巴发布的 AI 模型，发布时间为 2025-08-06，定位为聊天大模型，参数规模约为 40亿，上下文长度为 256K，模型文件大小约 8.05GB，采用 Apache 2.0 许可，在 AIME2025 上取得 81.30 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen3-4B-Thinking-2507

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

256K tokens

最大输出长度

16K tokens

模型类型

聊天大模型

输入/输出模态

文本 → 文本

发布时间

2025-08-06

模型文件大小

8.05GB

MoE架构

否

总参数 / 激活参数

40亿 / 不涉及

知识截止

暂无数据

Qwen3-4B-Thinking-2507

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen3

Hugging Face

https://huggingface.co/Qwen/Qwen3-4B-Thinking-2507

在线体验

https://chat.qwen.ai/

Qwen3-4B-Thinking-2507

官方介绍与博客

官方论文

Qwen3: Think Deeper, Act Faster

DataLearnerAI博客

暂无介绍博客

Qwen3-4B-Thinking-2507

API接口信息

接口速度

4/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$0.110/ 1M	$1.26/ 1M

Qwen3-4B-Thinking-2507

评测结果

Qwen3-4B-Thinking-2507 当前已收录的代表性评测结果包括 AIME2025（56 / 107，得分 81.30）、LiveCodeBench（83 / 123，得分 55.20）、GPQA Diamond（134 / 187，得分 65.80）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。