DataLearner logoDataLearnerAI
Latest AI Insights
Model Leaderboards
Benchmarks
Model Directory
Model Comparison
Resource Center
Tools
LanguageEnglish
DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

Products

  • Leaderboards
  • Model comparison
  • Datasets

Resources

  • Tutorials
  • Editorial
  • Tool directory

Company

  • About
  • Privacy policy
  • Data methodology
  • Contact

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

Privacy policyTerms of service
  1. Home/
  2. Blog List/
  3. Blog Detail

重磅!MetaAI开源4050亿参数的大语言模型Llama3.1-405B模型!多项评测结果超越GPT-4o,与Claude-3.5 Sonnet平分秋色!

2024/07/24 00:10:36
1,420 views
LlamaLlama3.1Llama3.1-405BMetaAI

Llama系列大语言模型是由MetaAI开源的一系列大语言模型。作为最早开源的大语言模型,Llama系列对大模型开源社区的推动有目共睹。而现在MetaAI开源Llama3.1系列模型,其中包括迄今为止最大规模的开源大语言模型Llama3.1-405B,参数规模达到了4050亿!其多项评测结果超过GPT-4、GPT-4o模型,与Claude3.5-Sonnet几乎有来有回!

  • Llama3.1系列模型简介
  • Llama3.1系列模型评测结果
  • Llama3.1系列模型的训练成本
  • Llama3.1系列模型的开源地址

Llama3.1系列模型简介

Llama3.1系列模型是Llama3系列模型继续训练的结果,包含3个不同参数规模的版本,分别是80亿参数规模的Llama3.1-8B、700亿参数规模的Llama3.1-70B和4050亿参数规模的Llama3.1-405B。这三个不同规模的模型训练数据量都达到了15万亿tokens。上下文长度均为128K。

模型名称训练数据参数规模输入模态输出模态上下文长度是否支持GQA训练tokens数量知识日期
Llama 3.1公开数据集80亿、700亿和4050亿多语言文本多语言文本和代码128k支持15万亿+2023年12月份

这里15万亿数据来自公开可用数据集,而微调数据集除了公开数据外,还包含了2500万合成的数据

Llama3.1模型支持多个不同的语种,但是仅支持文本输入和输出。Llama3.1系列模型依然是自回归架构的语言模型。其微调版本的模型做过有监督微调和RLHF训练。该模型支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。从上表也可以看出,Llama3.1系列模型支持代码输出。

Llama3.1系列模型评测结果

官方公布了Llama3.1系列模型的评测结果,从结果看,Llama3.1系列模型相比此前的Llama3系列模型提升似乎不明显。以80亿参数的Llama3.1-8B为例,其MMLU、ARC-Challenge、BoolQ得分几乎没有变化。但是在部分评测中如CommonSenseQA、BIG-Bench Hard有少许提升。

而最大规模的Llama3.1-405B的评测结果甚至很多方面不如Claude-3.5-Sonnet,十分奇怪。

根据DataLearnerAI收集的评测结果看,Llama3.1-405B-Instruct模型在各项评测中排名都很优秀,与GPT-4o、Claude3.5-Sonnet都很接近。

数据来源:https://www.datalearner.com/ai-models/leaderboard/datalearner-llm-leaderboard

其作为通用大模型,编程水平也是一级棒!

数据来源:https://www.datalearner.com/ai-models/leaderboard/datalearner-llm-coding-leaderboard

Llama3.1系列模型的训练成本

MetaAI一如既往的公布了Llama系列的训练时间和硬件信息,这一点也比较少见。如下表所示:

模型名称训练时长 (GPU小时)电耗 (W)基于地理位置温室气体排放 (tons CO2eq)基于市场温室气体排放 (tons CO2eq)
Llama 3.1 8B146万7004200
Llama 3.1 70B700万7002,0400
Llama 3.1 405B3084万7008,9300
Total39.3M11,3900

Llama3.1系列模型的开源地址

Llama3.1系列模型的开源协议是允许商用的,包括4050亿参数规模的Llama3.1-405B,但是使用的时候必须显著提示“Built with Llama”。此外,月活用户超过7亿,必须向Meta申请额外许可。但是,对于我们影响最大的还是该协议遵守贸易合规,这意味着受到制裁的企业可能无法使用。

Llama3.1系列模型的开源地址等其它信息参考DataLearnerAI大模型信息卡:

模型名称模型地址
Llama3.1-405Bhttps://www.datalearner.com/ai-models/pretrained-models/Llama3_1-405B
Llama3.1-405B-Instructhttps://www.datalearner.com/ai-models/pretrained-models/Llama3_1-405B-Instruct
Llama3.1-70Bhttps://www.datalearner.com/ai-models/pretrained-models/Llama3_1-70B
Llama3.1-70B-Instructhttps://www.datalearner.com/ai-models/pretrained-models/Llama3_1-70B-Instruct
Llama3.1-8Bhttps://www.datalearner.com/ai-models/pretrained-models/Llama3_1-8B
Llama3.1-8B-Instructhttps://www.datalearner.com/ai-models/pretrained-models/Llama3_1-8B-Instruct

DataLearner WeChat

Follow DataLearner WeChat for the latest AI updates

DataLearner 官方微信二维码
Back to Blog List

Related Blogs

  • Meta即将推出开源的CodeLLaMA:一种新的编程AI模型
  • 重磅!Meta发布LLaMA2,最高700亿参数,在2万亿tokens上训练,各项得分远超第一代LLaMA~完全免费可商用!
  • 抛弃RLHF?MetaAI发布最新大语言模型训练方法:LIMA——仅使用Prompts-Response来微调大模型
  • 能否用85000美元从头开始训练一个打败ChatGPT的模型,并在浏览器中运行?
  • Llama3相比较前两代的模型(Llama1和Llama2)有哪些升级?几张图简单总结Llama3的训练成本、训练时间、模型架构升级等情况
  • 开源王者!全球最强的开源大模型Llama3发布!15万亿数据集训练,最高4000亿参数,数学评测超过GPT-4,全球第二!
  • Meta上线了一个基于Emu文本生成图像大模型的图像生成系统Imagine:图像细节丰富、色彩鲜明、想象力很棒,而且免费使用!
  • MetaAI发布语音识别错误率是OpenAI的Whisper模型的一半且支持1107种语言的ASR模型:MMS

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署