QW

Qwen3-4B-2507

Qwen3-4B-2507

发布时间: 2025-08-06508
模型参数
40.0亿
上下文长度
256K
中文支持
支持
推理能力

模型基本信息

推理过程
不支持
上下文长度
256K tokens
最大输出长度
16384 tokens
模型类型
聊天大模型
发布时间
2025-08-06
模型文件大小
8.05GB
MoE架构
总参数 / 激活参数
40.0 亿 / 不涉及
知识截止
暂无数据
推理模式
常规模式(Non-Thinking Mode)

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0- 免费商用授权

官方介绍与博客

DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度
4/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.11$0.42

评测得分

综合评估

共 1 项评测
评测名称 / 模式
得分
排名/总数
62
98 / 140

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
35.10
85 / 99

数学推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
AIME2025normal
47.40
84 / 100

发布机构

模型解读

Qwen3-4B-2507是阿里发布的Qwen3-4B的更新版本,相比较4月28日,这个版本的模型拆分成thinking和非thinking不同的版本。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码