MI

Mixtral-8x22B-Instruct-v0.1

聊天大模型

Mixtral-8x22B-Instruct-v0.1

发布时间: 2024-04-17更新于: 2024-04-17 22:52:29587
在线体验GitHubHugging FaceCompare
模型参数
1410亿
上下文长度
64K
中文支持
不支持
推理能力

Mixtral-8x22B-Instruct-v0.1 是由 MistralAI 发布的 AI 模型,发布时间为 2024-04-17,定位为 聊天大模型,参数规模约为 1410亿,上下文长度为 64K,模型文件大小约 286GB,采用 Apache 2.0 许可,在 MMLU Pro 上取得 56.33 分。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Mixtral-8x22B-Instruct-v0.1

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
64K tokens
最大输出长度
暂无数据
模型类型
聊天大模型
输入/输出模态
暂无数据
发布时间
2024-04-17
模型文件大小
286GB
MoE架构
总参数 / 激活参数
1410亿 / 不涉及
知识截止
暂无数据
Mixtral-8x22B-Instruct-v0.1

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0- 免费商用授权
GitHub 源码
暂无GitHub开源地址
在线体验
暂无在线体验地址
Mixtral-8x22B-Instruct-v0.1

官方介绍与博客

Mixtral-8x22B-Instruct-v0.1

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Mixtral-8x22B-Instruct-v0.1

评测结果

Mixtral-8x22B-Instruct-v0.1 当前已收录的代表性评测结果包括 MMLU Pro(111 / 126,得分 56.33)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式

综合评估

共 1 项评测
评测名称 / 模式
得分
排名/总数
56.33
111 / 126

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Mixtral-8x22B-Instruct-v0.1

发布机构

Mixtral-8x22B-Instruct-v0.1

模型解读

MistralAI官方开源了2个版本的模型,一个是基础的预训练结果,一个是针对指令优化的模型。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码