智谱AI发布GLM-4.5V多模态推理模型

智谱AI刚刚开源了新一代视觉-语言模型（Vision-Language Model, VLM）——GLM-4.5V。该模型基于其旗舰文本基础模型GLM-4.5-Air（总参数量1060亿，激活参数量120亿），延续GLM-4.1V-Thinking的技术路线，在42项公开视觉多模态基准测试中，在同规模模型中实现领先性能。GLM-4.5V面向图像、视频、文档理解以及GUI任务等常见多模态场景，采用Mixture-of-Experts（MoE）架构，并保持开源。

智谱AI发布GLM-4.5V多模态推理模型

DataLearner 官方微信

GLM-4.5V的模型特点

GLM-4.5V模型的评测结果

智谱AI开源了一个桌面应用助手

GLM-4.5V的定价和总结

热门博客