MO

Moonlight-16B-A3B-Instruct

Moonlight-16B-A3B-Instruct

发布时间: 2025-02-23580
模型参数
160.0亿
上下文长度
8K
中文支持
支持
推理能力

模型基本信息

推理过程
不支持
上下文长度
8K tokens
最大输出长度
暂无数据
模型类型
暂无数据
发布时间
2025-02-23
模型文件大小
32GB
MoE架构
总参数 / 激活参数
160.0 亿 / 不涉及
知识截止
暂无数据
推理模式
暂无模式数据

开源和体验地址

代码开源状态
预训练权重开源
MIT License- 免费商用授权
在线体验
暂无在线体验地址

官方介绍与博客

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。

评测得分

综合评估

共 3 项评测
评测名称 / 模式
得分
排名/总数
MMLUnormal
70
53 / 59
BBHnormal
65.20
12 / 18
MMLU Pronormal
42.40
104 / 109

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
GSM8Knormal
77.40
17 / 24
MATHnormal
45.30
36 / 41

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
MBPPnormal
63.80
21 / 27
HumanEvalnormal
48.10
30 / 36

发布机构

模型解读

月之暗面开源的一个160以参数的混合专家大模型,每次推理参数共30亿。效果超过同类型的大模型。


本版本是其指令优化后的版本。




关于Moonlight-16B-A3B模型的详细介绍参考DataLearnerAI的官方博客: https://www.datalearner.com/blog/1051740316091143 

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码