ERNIE 5.0 Thinking Preview

Name: 文心一言 ERNIE 5.0 Thinking Preview
Author: 百度

推理大模型ERNIE 5.0

文心一言 ERNIE 5.0 Thinking Preview

发布时间: 2025-11更新于: 2026-04-06 11:21:59.641350

在线体验GitHubHugging FaceCompare

模型参数

2.4万亿

上下文长度

128K

中文支持

支持

推理能力

文心一言 ERNIE 5.0 Thinking Preview 是由百度发布的 AI 模型，发布时间为 2025-11，定位为推理大模型，参数规模约为 2.4万亿，上下文长度为 128K，采用不开源许可，在 Claw Bench 上取得 51.00 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

ERNIE 5.0 Thinking Preview

模型基本信息

推理过程

支持

思考模式

思考模式 (默认)常规模式

上下文长度

128K tokens

最大输出长度

8K tokens

模型类型

推理大模型

输入/输出模态

暂无数据

发布时间

2025-11

模型文件大小

暂无数据

MoE架构

是

总参数 / 激活参数

2.4万亿 / 不涉及

知识截止

暂无数据

ERNIE 5.0 Thinking Preview

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://ernie.baidu.com/

ERNIE 5.0 Thinking Preview

官方介绍与博客

官方论文

ERNIE 5.0: A 2.4 Trillion-Parameter Unified Multimodal Foundation Model

DataLearnerAI博客

暂无介绍博客

ERNIE 5.0 Thinking Preview

API接口信息

接口速度

3/5

暂无公开的 API 定价信息。

ERNIE 5.0 Thinking Preview

评测结果

ERNIE 5.0 Thinking Preview 当前已收录的代表性评测结果包括 Claw Bench（29 / 29，得分 51）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

OpenClaw智能体能力综合测评

共 1 项评测

评测名称 / 模式

得分

排名/总数

Claw Bench

思考模式

29 / 29

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

ERNIE 5.0 Thinking Preview

发布机构

百度

查看发布机构详情

文心一言 ERNIE 5.0 Thinking Preview

模型解读

ERNIE 5.0 Thinking Preview是百度于2025年11月发布的文心大模型5.0系列的预览版模型。2026年1月22日，百度正式发布了文心大模型5.0的正式版本，参数量达到2.4万亿，采用原生全模态统一建模技术，支持文本、图像、音频、视频等多种信息的输入与输出。ERNIE 5.0 Thinking Preview可视为正式版发布前的推理优化分支型号，专注于纯文本任务场景。

二、技术架构

根据百度ERNIE 5.0的技术报告，模型的底层架构采用Ultra-Sparse MoE（混合专家）架构，总参数量达到万亿级别，但在推理时实际激活的参数占比低于3%。该架构的特点是模态无关的专家路由机制，所有模态的数据在同一共享专家池中处理，不预先区分视觉、语言等标签。

此外，ERNIE 5.0引入了弹性预训练范式（Elastic Training），通过弹性深度和弹性宽度机制，从一次预训练中可抽取不同规格的子模型，降低重复训练的成本。

在对齐阶段，模型采用统一多模态强化学习策略，将逻辑推理、指令跟随与多模态生成任务纳入同一强化学习流程中协同优化。

三、性能数据

3.1 推理能力

根据第三方评测平台llmbase.ai的数据，ERNIE 5.0 Thinking Preview在GPQA（研究生级别科学推理测试）中取得77.7%的得分。MMLU Pro得分为83.0%，HLE（人类最后考试）得分为12.7%。该模型在LLMBase的数学复合指标中得分85.0。

3.2 代码能力

在编码任务方面，ERNIE 5.0 Thinking Preview的编码指数（Coding Index）为29.2。LiveCodeBench得分为81.2%，SciCode得分为37.5%。

3.3 榜单表现

LMArena大模型竞技场的历史数据显示，ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜，位列中国第一。在创意写作和高难度指令理解等维度上，该模型的得分超过了Claude-Opus-4.1、GPT-5.2、GPT-5.1以及Qwen3-Max-Preview等主流模型。2026年1月15日，正式版模型ERNIE-5.0-0110以1460分登上LMArena文本榜国内第一、全球第八，数学能力排名全球第二。

四、定价与使用限制

ERNIE 5.0 Thinking Preview通过百度智能云千帆平台提供API服务，定价如下：

计费项价格（输入≤32k tokens）价格（32k<输入≤128k tokens）

输入￥0.80 / 百万 tokens￥1.00 / 百万 tokens

输出￥3.20 / 百万 tokens￥4.00 / 百万 tokens

上下文窗口为128,000 tokens，最大输出为8,192 tokens。模型为闭源模型，不支持权重开源。需要说明的是，不同第三方平台（如llmbase.ai）显示的定价存在差异——部分平台标注的输入输出价格为$0.00/1M，这一数据并非官方计费信息，可能是由于第三方平台与百度千帆官方定价系统的同步差异所致，实际使用时应以百度千帆官方文档为准。

五、使用场景

根据官方及第三方平台的说明，ERNIE 5.0 Thinking Preview主要适用于以下场景：

适合场景：

纯文本问答与对话
内容摘要与分类
代码生成与软件开发
企业知识问答（基于128k上下文窗口）
复杂推理任务

不适合场景：

强依赖图像、截图或视觉理解的任务（该模型以纯文本任务为主）
输出极长的生成任务（输出成本较高，需评估预算）

六、小结

ERNIE 5.0 Thinking Preview是百度文心5.0系列中侧重推理和纯文本处理的预览版本。从第三方评测数据来看，其在GPQA（77.7%）、MMLU Pro（83.0%）、LiveCodeBench（81.2%）等基准测试中表现稳定，并在LMArena榜单中取得过国内前列的排名。该模型通过千帆平台以按量计费方式提供，上下文窗口128k tokens，适合处理中等规模的企业知识问答、代码生成和复杂推理类任务。作为预览版本，其定价和能力边界可能在正式版本发布后有所调整。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送