DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Page navigation
目录
Model catalogQwen3-Coder-480B-A35B
QW

Qwen3-Coder-480B-A35B

Qwen3-Coder-480B-A35B-Instruct

Release date: 2025-07-23更新于: 2025-07-23 13:16:042,128
Live demoGitHubHugging FaceCompare
Parameters
4800.0亿
Context length
256K
Chinese support
Supported
Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Qwen3-Coder-480B-A35B

Model basics

Reasoning traces
Not supported
Context length
256K tokens
Max output length
16384 tokens
Model type
编程大模型
Release date
2025-07-23
Model file size
470.77 GB
MoE architecture
Yes
Total params / Active params
4800.0B / 350B
Knowledge cutoff
No data
Inference modes
常规模式(Non-Thinking Mode)
Qwen3-Coder-480B-A35B

Open source & experience

Code license
Apache 2.0
Weights license
Apache 2.0- 免费商用授权
GitHub repo
https://github.com/QwenLM/Qwen3-Coder
Hugging Face
https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct
Live demo
https://chat.qwen.ai/
Qwen3-Coder-480B-A35B

Official resources

Paper
Qwen3-Coder: Agentic Coding in the World
DataLearnerAI blog
阿里开源全新编程大模型Qwen3-Coder-480B-A35B,官方宣称其编程水平接近Claude Sonnet 4,免费开源可商用,同时开源Claude Code免费平替选择Qwen Code
Qwen3-Coder-480B-A35B

API details

API speed
3/5
No public API pricing yet.
Qwen3-Coder-480B-A35B

Benchmark Results

编程与软件工程

1 evaluations
Benchmark / mode
Score
Rank/total
SWE-bench VerifiedNormal
67
51 / 87

AI Agent - 工具使用

1 evaluations
Benchmark / mode
Score
Rank/total
Terminal-BenchNormal
37.50
15 / 35

综合评估

1 evaluations
Benchmark / mode
Score
Rank/total
LiveBenchNormal
61.66
41 / 52
查看评测深度分析与其他模型对比
Qwen3-Coder-480B-A35B

Model variants & downloads

Variant nameVersion typeQuantizationModel sizeHuggingFace link
Qwen3-Coder-480B-A35B-Instructℹ️InstructFP8482.24 GBDownload link
Qwen3-Coder-480B-A35B-Instructℹ️InstructFP16961.27 GBDownload link
Qwen3-Coder-480B-A35B

Publisher

阿里巴巴
阿里巴巴
View publisher details
Qwen3-Coder-480B-A35B-Instruct

Model Overview

Qwen3-Coder是一个由Qwen团队宣布推出的新型代码模型系列,被定位为他们迄今为止最具智能体(agentic)能力的模型。该系列提供多种尺寸,其中Qwen3-Coder-480B-A35B-Instruct是率先推出并作为其最强大的变体。

主要增强功能包括:

    Qwen3-480B-A35B-Instruct模型概览:

    • 性能表现: 该模型在智能体编码(Agentic Coding)、智能体浏览器使用(Agentic Browser-Use)以及其他基础编码任务上,在开放模型中展现出显著性能,据称其结果可与Claude Sonnet媲美。
    • 长上下文能力: 原生支持256K tokens的上下文长度,并可利用Yarn技术扩展至1M tokens,旨在优化对代码仓库级别(repository-scale)的理解。
    • 智能体编码支持: 为Qwen Code、CLINE等多数平台提供智能体编码支持,并采用专门设计的函数调用格式。


    特殊说明:

    • 类型: 因果语言模型(Causal Language Models)。
    • 训练阶段: 经历了预训练(Pretraining)和后训练(Post-training)。
    • 参数数量: 总参数量为4800亿(480B),其中激活参数量为350亿(35B),这表明它采用了某种稀疏激活或MoE(Mixture-of-Experts)架构。
    • 层数: 62层。
    • 注意力头(GQA): 96个查询(Q)头和8个键值(KV)头,使用了分组查询注意力(Grouped Query Attention, GQA)机制。
    • 专家数量: 总共有160个专家(Experts),每次激活8个专家。
    • 上下文长度: 原生支持262,144 tokens的上下文长度。


    DataLearner 官方微信

    欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

    DataLearner 官方微信二维码