Qw

QwQ-32B-Preview

推理大模型

QwQ-32B-Preview

发布时间: 2024-11-28

GitHub Hugging Face 在线体验

模型参数（Parameters）

320.0

最高上下文长度（Context Length）

32K

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

32K tokens

最长输出结果

暂无数据

模型类型

推理大模型

发布时间

2024-11-28

模型预文件大小

64GB

开源和体验地址

代码开源状态

预训练权重开源

Apache 2.0 - 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen2.5

Hugging Face

https://huggingface.co/Qwen/QwQ-32B-Preview

在线体验

https://huggingface.co/spaces/Qwen/QwQ-32B-preview

官方介绍与博客

官方论文

QwQ: Reflect Deeply on the Boundaries of the Unknown

DataLearnerAI博客

暂无介绍博客

API接口信息

接口速度（满分5分）

暂无数据

接口价格

输入价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输出价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding（向量）

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding（向量）

输出不支持

QwQ-32B-Preview模型在各大评测榜单的评分

评测基准名称 / 模式

评测类型

评测结果

评测基准 MMLU Pro

模式 / 类型

normal / 知识问答

评测结果

70.97

MMLU Pro normal

知识问答

70.97

评测基准 MATH-500

模式 / 类型

normal / 数学推理

评测结果

90.6

MATH-500 normal

数学推理

90.6

评测基准 AIME 2024

模式 / 类型

normal / 数学推理

评测结果

50.0

AIME 2024 normal

数学推理

50.0

发布机构

阿里巴巴

查看发布机构详情

模型介绍

QwQ-32B-Preview 是 Qwen 团队开发的一个实验性研究模型，旨在推进人工智能推理能力。作为一个32B（320亿参数）的预览版模型，它专注于提高复杂问题求解和分析能力。

性能指标

在多个学术和技术基准测试中，模型展现了显著的性能：

GPQA（研究生级科学问题）：65.2% 准确率
AIME（数学评估）：50.0% 准确率
MATH-500（数学问题解决）：90.6% 准确率
LiveCodeBench（代码生成和问题解决）：50.0% 准确率

关键技术特点

推理机制

强调深度思考和多步骤推理
通过自我质疑和反思提高问题解决能力
模拟类似人类的逻辑推理过程

主要研究方向

过程奖励模型
大语言模型批评
多步骤推理技术
系统反馈强化学习

已知局限性

语言处理

可能出现意外的语言混合和代码切换

推理过程

存在进入递归推理循环的风险

性能边界

在数学和编程领域表现出色
常识推理和语言细微理解有待改进

安全性

需要进一步完善安全保障机制

应用场景

基于其在数学、编程和科学问题解决方面的优势，QwQ-32B-Preview 模型适用于：

复杂数学问题求解
编程挑战和算法开发
科学研究中的逻辑推理
需要深度分析的技术性任务

该模型代表了人工智能推理能力研究的重要一步，展示了通过深度思考和自我反思提升机器学习模型能力的潜力。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯

DataLearnerAI WeChat