Qw

QwQ-32B-Preview

推理大模型

QwQ-32B-Preview

发布时间: 2024-11-28

模型参数(Parameters)
320.0
最高上下文长度(Context Length)
32K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

32K tokens

最长输出结果
暂无数据
模型类型

推理大模型

发布时间

2024-11-28

模型预文件大小

64GB

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0 - 免费商用授权
GitHub 源码
Hugging Face
在线体验

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

QwQ-32B-Preview模型在各大评测榜单的评分

评测基准名称
MMLU Pro
(知识问答)
评测结果:70.97
评测基准名称
MATH-500
(数学推理)
评测结果:90.6
评测基准名称
AIME 2024
(数学推理)
评测结果:50.0

发布机构

模型介绍

QwQ-32B-Preview 是 Qwen 团队开发的一个实验性研究模型,旨在推进人工智能推理能力。作为一个32B(320亿参数)的预览版模型,它专注于提高复杂问题求解和分析能力。

性能指标

在多个学术和技术基准测试中,模型展现了显著的性能:

  1. GPQA(研究生级科学问题):65.2% 准确率
  2. AIME(数学评估):50.0% 准确率
  3. MATH-500(数学问题解决):90.6% 准确率
  4. LiveCodeBench(代码生成和问题解决):50.0% 准确率

关键技术特点

推理机制

  • 强调深度思考和多步骤推理
  • 通过自我质疑和反思提高问题解决能力
  • 模拟类似人类的逻辑推理过程

主要研究方向

  • 过程奖励模型
  • 大语言模型批评
  • 多步骤推理技术
  • 系统反馈强化学习

已知局限性

  1. 语言处理
  • 可能出现意外的语言混合和代码切换
  1. 推理过程
  • 存在进入递归推理循环的风险
  1. 性能边界
  • 在数学和编程领域表现出色
  • 常识推理和语言细微理解有待改进
  1. 安全性
  • 需要进一步完善安全保障机制

应用场景

基于其在数学、编程和科学问题解决方面的优势,QwQ-32B-Preview 模型适用于:

  • 复杂数学问题求解
  • 编程挑战和算法开发
  • 科学研究中的逻辑推理
  • 需要深度分析的技术性任务

该模型代表了人工智能推理能力研究的重要一步,展示了通过深度思考和自我反思提升机器学习模型能力的潜力。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat