DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Page navigation
目录
Model catalogGLM-4.5-Air
GL

GLM-4.5-Air

GLM-4.5-MoE-106B-A12B-0715

Release date: 2025-07-28更新于: 2025-07-29 11:13:42931
Live demoGitHubHugging FaceCompare
Parameters
1060.0亿
Context length
128K
Chinese support
Supported
Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

GLM-4.5-Air

Model basics

Reasoning traces
Supported
Context length
128K tokens
Max output length
97280 tokens
Model type
推理大模型
Release date
2025-07-28
Model file size
212 GB
MoE architecture
Yes
Total params / Active params
1060.0B / 120B
Knowledge cutoff
No data
Inference modes
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
GLM-4.5-Air

Open source & experience

Code license
Apache 2.0
Weights license
Apache 2.0- 免费商用授权
GitHub repo
https://github.com/THUDM/GLM-4
Hugging Face
https://huggingface.co/zai-org/GLM-4.5-Air
Live demo
https://chat.z.ai/
GLM-4.5-Air

Official resources

Paper
GLM-4.5: Reasoning, Coding, and Agentic Abililties
DataLearnerAI blog
Zhipu AI重磅发布GLM-4.5系列:技术深度解析与多维度性能评测
GLM-4.5-Air

API details

API speed
3/5
💡Default unit: $/1M tokens. If vendors use other units, follow their published pricing.
Standard pricingStandard
ModalityInputOutput
Text$0.2$1.1
GLM-4.5-Air

Benchmark Results

Thinking

综合评估

4 evaluations
Benchmark / mode
Score
Rank/total
MMLU ProThinking
81.40
37 / 112
GPQA DiamondThinking
75
71 / 153
LiveBenchNormal
60.53
42 / 52
HLEThinking
10.60
81 / 105

编程与软件工程

2 evaluations
Benchmark / mode
Score
Rank/total
LiveCodeBenchThinking
70.70
34 / 103
SWE-bench VerifiedThinking
57.60
62 / 87

数学推理

2 evaluations
Benchmark / mode
Score
Rank/total
MATH-500Thinking
98.10
5 / 42
AIME 2024Thinking
89.40
15 / 62

AI Agent - 工具使用

1 evaluations
Benchmark / mode
Score
Rank/total
Terminal-BenchThinking
30
22 / 35
查看评测深度分析与其他模型对比
GLM-4.5-Air

Publisher

智谱AI
智谱AI
View publisher details
GLM-4.5-MoE-106B-A12B-0715

Model Overview

GLM-4.5-106B-A12B是智谱AI开源的MoE架构的大模型,总参数1060亿,每次推理激活120亿参数。


在官方的帕累托前沿分析中,GLM-4.5-Air被定位为同等规模下性能最优的模型之一。在12项基准测试中,其综合性能位列第六,超过了许多更大规模的模型。

  • Agent与工具调用能力:令人印象深刻的是,GLM-4.5-Air在核心Agent任务上的表现与旗舰版的GLM-4.5相差无几。在τ-bench(69.4 vs 70.1)和BFCL v3(76.4 vs 77.8)基准上,其分数非常接近,这意味着用户可以用更低的成本获得几乎同等水平的函数调用和基础Agent能力。
  • 推理能力:GLM-4.5-Air的推理能力依然强劲。在AIME24和MATH 500等数学基准上,其得分(89.4和98.1)依然处于顶级水平。虽然在MMLU Pro等更广泛的知识性基准上与GLM-4.5有一定差距,但其表现足以应对绝大多数商业和个人应用中的推理需求。
  • 代码能力:在代码能力上,GLM-4.5-Air与旗舰版存在一定差距,特别是在复杂的软件工程任务SWE-bench上(57.6 vs 64.2)。尽管如此,它的性能依然足以胜任日常的编码辅助、代码片段生成和简单的脚本编写任务。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码