大模型追踪利器!斯坦福大学发布基础大模型追踪图谱Ecosystem Graphs
随着ChatGPT在全球的火爆,预训练大模型技术被全球广泛关注。除了OpenAI、Google、百度这样的巨头在努力提供大模型服务外,各个科技企业以及学术界也都在发布自己的大模型。
下图展示了DataLearner收集的大模型概览图:

可以看到,很多企业都在发布各种不同的模型。但是,实际上,这些模型也不是一下蹦出来的,很多模型之间也是有依赖和联系的。并且,基于这些模型开发的应用则更加繁杂。这些眼花缭乱的关系基本上很难追踪。例如,Github Copilot就是一个GitHub提供的代码补全应用,但是实际上它背后依赖的是OpenAI的Codex模型,而Codex模型本身则来自GPT-3。这样的联系在如今每天都有大模型和新应用发布的年代,很难轻易被追踪!
尽管像Datalearner这样的网站提供了大模型的列表和介绍,但是大模型之间的联系和依赖,以及围绕大模型的资产如数据集、应用等都很难轻松看出来。而斯坦福大学发布的基础大模型追踪图谱Ecosystem Graphs,用图谱的方式给大家呈现了模型之间的联系,让人非常清楚明白追踪不同模型之间的关系。
下图就是这个图谱的全景图:




