DataLearner logoDataLearnerAI
AI Tech Blogs
Leaderboards
Benchmarks
Models
Resources
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
  1. Home/
  2. Blog List/
  3. Blog Detail

马斯克旗下xAI发布Grok-1.5,相比较开源的Grok-1,各项性能大幅提升,接近GPT-4!

2024/03/29 09:21:54
914 views
GrokGrok-1Grok-1.5xAI马斯克

DataLearner WeChat

Follow DataLearner WeChat for the latest AI updates

DataLearner 官方微信二维码
Back to Blog List

Related Blogs

马斯克大模型企业xAI开源Grok-1,截止目前全球规模最大的MoE大模型,词汇表超过13万!重磅!马斯克宣布本周开源xAI开发的大语言模型Grok!马斯克的X.AI平台即将发布的大模型Grōk AI有哪些能力?新消息泄露该模型支持2.5万个字符上下文!马斯克创造的新的大模型企业xAI的大模型GrokAI模型评测结果出炉~MMLU与代码评分超过ChatGPT-3.5AIME 2025满分,xAI正式发布Grok模型,其中Grok 4 Heavy评测超越当前所有大模型,美国数学竞赛满分!一年3000美元订阅费!Grok-4未发布评测结果已泄露:2个版本,支持长推理输出,但是最高上下文仅132K,泄露的评测数据显示Grok4是迄今为止得分最高的大模型,甚至大幅超越Gemini 2.5 Pro!

Hot Blogs

1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)2回归模型中的交互项简介(Interactions in Regression)3贝塔分布(Beta Distribution)简介及其应用4矩母函数简介(Moment-generating function)5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程6使用R语言进行K-means聚类并分析结果7深度学习技巧之Early Stopping(早停法)8H5文件简介和使用9手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署10Wishart分布简介

Grok系列是马斯克旗下的人工智能企业xAI发布的大语言模型,在推特上给大家使用。第一个版本,Grok-1前端时间 开源,效果一般。就在刚才,xAI宣布他们开始内测Grok-1.5,即将全面商用!

Grok-1.5介绍

目前,官网没有公布Grok-1.5的任何技术细节,只说了这个版本的Grok-1.5在推理和其它任务解决的能力方面大幅提升。下图展示了Grok-1.5和其它模型的对比结果:

可以看到,在综合理解能力MMLU评测上,Grok-1.5达到了81.3分的成绩,超过了MistralAI当前最好的模型Mixtral Large,而数学推理能力GSM8K的成绩达到了90分!与GPT-4、Claude-3 Sonnet几乎差不多。

相比较此前的Grok-1,用来3124个参数得到的惨淡结果,这个提升非常明显!关于Grok-1信息参考:https://www.datalearner.com/blog/1051710739726469

Grok-1.5在DataLearnerAI综合评测排行

在DataLearnerAI收集的全球大模型综合评测数据上,Grok-1.5表现也非常好。按照GSM8K排序,结果如下:

数据来源:https://www.datalearner.com/ai-models/llm-evaluation

可以看到,GSM8K在目前的评测上,Grok-1.5已经是全球第四,最好的模型之一了。其它评测结果也是类似,说明Grok-1.5已经达到了第一梯队。而按照编程能力评测的结果,以Human Eval排序为例,结果如下:

数据来源:https://www.datalearner.com/ai-models/llm-coding-evaluation

可以看到,Grok-1.5依然排名很高,作为一个综合基础大模型,这样的成绩非常好。略超Claude3-Sonnet!

Grok-1.5支持最高128K上下文

另一个值得关注的是,Grok-1.5支持最高128K的上下文长度。相比较第一代8K也大幅提升。在大海捞针测试中,表现很好:

Grok-1.5的具体发布情况

目前xAI官方说Grok-1.5将会邀请早期测试者测试,后续逐渐扩大到所有用户。至于后续是否开源,目前没有信息!希望下一代Grok出来之前能让Grok-1.5开源!

关于Grok-1.5的后续情况参考DataLearnerAI的Grok-1.5模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/Grok-1_5