百度在周末发布了2个新一代文心一言大模型,分别是没有推理能力的ERNIE 4.5以及有推理能力的ERNIE X1,即日起可以免费使用
3月16日,百度宣布推出两款新一代文心大模型——ERNIE 4.5与ERNIE X1,并提前向公众免费开放其智能对话平台“文心一言”(ERNIE Bot)。官方宣称,这两款模型的能力均超过了GPT-4o,但是价格只有GPT-4o的1%,且是DeepSeek的一半。
尽管官方宣布未来几个月开源,但是目前官方只在推特发了消息,没有官方博客介绍,实在是令人费解百度的操作(今天才发现百度没有官方博客介绍自己的模型和更新情况,真是神级产品思路!)。
ERNIE 4.5:多模态大模型,没有思维链推理模式
作为百度新一代原生多模态基础模型,ERNIE 4.5的核心优势在于其跨模态的理解与生成能力。它能够无缝整合文本、图像、音频和视频内容,甚至能解读互联网文化中的梗图与讽刺漫画。例如,当用户输入一张包含流行网络梗的图片时,ERNIE 4.5不仅能识别画面元素,还能结合上下文理解其中的幽默或隐喻。
技术层面,ERNIE 4.5通过“FlashMask动态注意力遮蔽”和“异质多模态混合专家”架构,实现了多模态数据的协同优化。据百度披露,该模型在多项基准测试中已超越GPT-4o,而成本仅为后者的1%。
下图是官网给出的一个对比结果。其多模态能力和GPT-4o对比如下:

其文本能力和GPT-4o对比如下:

当然,除了均值,其它数据均是“模糊”的。
ERNIE X1:最新一代推理大模型
如果说ERNIE 4.5是“多面手”,那么ERNIE X1则更像一位“策略家”。作为百度首个支持工具调用的深度推理模型,X1的强项在于逻辑规划与复杂任务处理。例如,它可以通过调用代码解释器解决数学难题,或结合高级搜索功能为企业生成市场分析报告。
更值得注意的是,X1的“进化能力”使其在反复交互中逐步优化输出结果。这种特性使其在文学创作、学术研究等需要长期思考的场景中尤为突出。例如,用户若要求X1撰写一篇商业计划书,模型不仅能生成初稿,还能根据反馈调整结构、补充数据,甚至自动调用行业数据库更新内容。
ERINE 4.5和ERINE X1实际测试
为了测试这两个模型的能力,我们构造了一个复杂的计算题,如下:
一个商店,牛肉30元一斤,猪肉20元一斤,茄子5元一斤,西红柿6元一斤,豆角1元一斤,每个月28日是会员日,会员每个月费用20元。购买肉类可以八折,但是最多3斤,打折从最便宜的品类开始。那么小红在3月28日购买了2.5斤牛肉和3.5斤猪肉,3斤西红柿,随后退了1斤猪肉,小红是会员,那么小红花费了多少钱
最终结果显示,DeepSeek V3回答错误,DeepSeek R1错误,ERINE 4.5回答错误,ERINE X1回答正确。可以说,ERINE X1有点东西。不过这只是一次测试而已,但至少说明ERINE X1还可以。
百度开始走免费开放与开源的路子
百度此次提前开放ERNIE Bot的免费访问,无疑降低了AI技术的使用门槛。个人用户现可通过官网直接体验两大模型,而企业开发者则能通过百度智能云千帆平台接入API。
并且官方还透露,即将未来几个月开源ERINE 4.5系列。
关于后续ERINE 4.5和ERINE X1的开源信息和在线演示地址可以参考DataLearnerAI大模型信息卡:
https://www.datalearner.com/ai-models/pretrained-models/ERNIE-X1
https://www.datalearner.com/ai-models/pretrained-models/ERNIE-4_5
欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
