Mo

Moonlight-16B-A3B-Instruct

聊天大模型

Moonlight-16B-A3B-Instruct

发布时间: 2025-02-23

521
模型参数(Parameters)
160.0
最高上下文长度(Context Length)
8K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

8K tokens

最长输出结果
暂无数据
模型类型

聊天大模型

发布时间

2025-02-23

模型预文件大小

32GB

开源和体验地址

代码开源状态
预训练权重开源
MIT License - 免费商用授权
GitHub 源码
Hugging Face
在线体验
暂无在线体验地址

API接口信息

接口速度(满分5分)
暂无数据
接口价格
暂无公开的 API 定价信息。

Moonlight-16B-A3B-Instruct模型在各大评测榜单的评分

综合评估

共 3 项评测
MMLU normal
70
53 / 59
BBH normal
65.20
12 / 18
MMLU Pro normal
42.40
100 / 105

数学推理

共 2 项评测
GSM8K normal
77.40
17 / 24
MATH normal
45.30
36 / 41

编程与软件工程

共 2 项评测
MBPP normal
63.80
21 / 27
HumanEval normal
48.10
30 / 36

发布机构

Moonlight-16B-A3B-Instruct模型解读

月之暗面开源的一个160以参数的混合专家大模型,每次推理参数共30亿。效果超过同类型的大模型。


本版本是其指令优化后的版本。




关于Moonlight-16B-A3B模型的详细介绍参考DataLearnerAI的官方博客: https://www.datalearner.com/blog/1051740316091143 

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat