OR

Orion-14B-Base

基础大模型Orion

Orion-14B-Base

发布时间: 2024-01-22更新于: 2024-01-22 15:37:28.918229
模型参数
140亿
上下文长度
200K
中文支持
支持
推理能力

Orion-14B-Base 是由 猎户星空科技 发布的 AI 模型,发布时间为 2024-01-22,定位为 基础大模型,参数规模约为 140亿,上下文长度为 200K,模型文件大小约 28GB,采用 Orion-14B Series Models Community License 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Orion-14B-Base

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
200K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2024-01-22
模型文件大小
28GB
MoE架构
总参数 / 激活参数
140亿 / 不涉及
知识截止
暂无数据
Orion-14B-Base

开源和体验地址

代码开源状态
预训练权重开源
在线体验
暂无在线体验地址
Orion-14B-Base

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
Orion-14B-Base

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Orion-14B-Base

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Orion-14B-Base

发布机构

猎户星空科技
猎户星空科技
查看发布机构详情
Orion-14B-Base

模型解读

Orion-14B-Base是猎豹移动投资的企业猎户星座开源的一个大语言模型。该模型主要特点如下:

  • 基于2.5万亿tokens数据集预训练得到;
  • 在200亿参数规模的大模型中表现优异;
  • 支持多语言,包括中文、英文、韩文和日语;
  • 在200K上下文下表现很好,最高支持320K上下文输入长度;
  • 量化版本模型大小减少70%,推理速度提升30%,但是性能损失不到1%;


Orion-14B模型评测结果


官方公布了Orion-14B模型的评测结果,但是主要是语言理解这块,MMLU几乎和GPT-3.5差不多,也和650亿参数的其它模型差不多。不过需要注意的时候,GSM8K这个测评以及代码编程能力结果并未公布!DataLearnerAI的大模型评测按照MMLU排序结果如下:



上述网址参考: https://www.datalearner.com/ai-models/llm-evaluation 

可以说Orion-14B非常优秀:

ModelC-EvalCMMLUMMLUAGIEvalGaokaoBBH
LLaMA2-13B41.438.455.030.918.245.6
Skywork-13B59.161.462.743.656.148.3
Baichuan2-13B59.061.359.537.445.649.0
QWEN-14B71.770.267.951.962.553.7
InternLM-20B58.859.062.144.645.552.5
Orion-14B-Base72.970.669.954.762.156.5


按照这个MMLU得分69.9估计的话,与GPT-3.5和Mistral-7B-MoE接近。Mixtral-8×7B-MoE是专家混合模型,参考: https://www.datalearner.com/ai-models/pretrained-models/Mistral-7B-MoE 



更重要的是,Orion-14B模型在多语言上表现也很好:


ModelTrain LangJapaneseKoreanChineseEnglish
PLaMo-13BEn,Jp52.3***
Weblab-10BEn,Jp50.7***
ELYZA-jp-7BEn,Jp48.8***
StableLM-jp-7BEn,Jp51.1***
KoGPT-6BEn,Ko*70.1**
Polyglot-ko-13BEn,Ko*70.7**
Baichuan2-13BMulti57.158.750.857.1
Qwen-14BMulti65.873.764.565.4
Llama2-13BMulti46.363.741.455.3
Yi-34BMulti67.172.258.768.8
Orion-14B-ChatMulti69.179.567.967.3


从这个对比看,汉语和日语表现不输中文。



Orion-14B模型版本


Orion-14B官方共发布了7个版本:

Orion-14B模型版本模型简介HuggingFace下载链接
⚾Orion-14B-Base140亿参数的基座版本Orion-14B-Base
😛Orion-14B-Chat在基座版本上针对对话进行调优的版本,适合对话Orion-14B-Chat
📃Orion-14B-LongChat长上下文优化的对话版本Orion-14B-LongChat
🔎Orion-14B-Chat-RAG针对检索生成优化的版本Orion-14B-Chat-RAG
🔌Orion-14B-Chat-Plugin针对插件优化的版本Orion-14B-Chat-Plugin
💼Orion-14B-Base-Int4基座模型的Int4量化版本Orion-14B-Base-Int4
📦Orion-14B-Chat-Int4聊天对齐模型的Int4量化版本Orion-14B-Chat-Int4


DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码