Mistral Small 24B Instruct 2501

Name: Mistral Small 3 - 24B - Instruct
Price: 0.05 USD
Availability: InStock
Author: MistralAI

基础大模型Small 24B

Mistral Small 3 - 24B - Instruct

发布时间: 2025-01-30更新于: 2025-01-31 10:15:57669

在线体验GitHubHugging Face Compare

模型参数

240亿

上下文长度

32K

中文支持

支持

推理能力

Mistral Small 3 - 24B - Instruct 是由 MistralAI 发布的 AI 模型，发布时间为 2025-01-30，定位为基础大模型，参数规模约为 240亿，上下文长度为 32K，模型文件大小约 48GB，采用 Apache 2.0 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Mistral Small 24B Instruct 2501

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

32K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

文本 → 文本

发布时间

2025-01-30

模型文件大小

48GB

MoE架构

否

总参数 / 激活参数

240亿 / 不涉及

知识截止

暂无数据

Mistral Small 24B Instruct 2501

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

暂无GitHub开源地址

Hugging Face

https://huggingface.co/mistralai/Mistral-Small-24B-Instruct-2501

在线体验

暂无在线体验地址

Mistral Small 24B Instruct 2501

官方介绍与博客

官方论文

Mistral Small 3 Apache 2.0, 81% MMLU, 150 tokens/s

DataLearnerAI博客

暂无介绍博客

Mistral Small 24B Instruct 2501

API接口信息

接口速度

暂无数据

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$0.050/ 1M	$0.080/ 1M

Mistral Small 24B Instruct 2501

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Mistral Small 24B Instruct 2501

发布机构

MistralAI

查看发布机构详情

Mistral Small 3 - 24B - Instruct

模型解读

Mistral Small 3 是一款 24B 参数的模型，经过低延迟优化，并以 Apache 2.0 许可证发布。它旨在成为像 Llama 3.3 70B 和 Qwen 32B 这样的大型模型的有力竞争者，甚至超越了一些像 GPT4o-mini 这样的专有模型。该模型经过预训练和指令调优，适用于需要强大语言能力和指令遵循能力的广泛生成式 AI 任务。

主要特点

低延迟：Mistral Small 3 经过优化，能够提供极低的延迟，适合实时应用。它在 MMLU 基准测试中达到超过 81% 的准确率，同时保持每秒 150 个标记的延迟。
高效性：与竞争对手相比，该模型的层数更少，这显著减少了每次前向传递的时间。这种设计使其非常适合本地部署。
开源：以 Apache 2.0 许可证发布，Mistral Small 3 可自由修改和部署。这种开放性使得该模型能够应用于广泛的场景并进行定制。

性能基准测试

人类评估

Mistral AI 使用外部第三方供应商进行了人类评估。评估者比较了 Mistral Small 3 与另一款模型在超过 1000 个专有编码和通用提示上的匿名响应。结果表明，Mistral Small 3 的表现具有竞争力，经常被评估者选为更优选项。

指令性能

经过指令调优的 Mistral Small 3 在各种基准测试中表现出色，包括代码、数学、通用知识和指令遵循。它与三倍于自身大小的模型以及像 GPT4o-mini 这样的专有模型竞争激烈。

预训练性能

尽管 Mistral Small 3 的体积较小，但其性能与 Llama 3.3 70B 等大型模型相当。这使得它成为那些受模型大小和计算资源限制的应用场景的理想选择。

使用案例

由于其高效性和性能，Mistral Small 3 适用于多种应用：

快速响应式对话助手：适用于需要快速准确响应的虚拟助手。
低延迟函数调用：在需要快速函数执行的自动化工作流程中非常有用。
针对专业化的微调：可以针对特定领域进行微调，例如法律咨询、医疗诊断和技术支持。
本地推理：对于处理敏感信息的爱好者和组织特别有益。它可以在 RTX 4090 或配备 32GB 内存的 Macbook 等设备上私下运行。

可用性和集成

Mistral Small 3 已在 la Plateforme 上作为 mistral-small-latest 或 mistral-small-2501 提供。它还正在与 Hugging Face、Ollama、Kaggle、Together AI 和 Fireworks AI 等平台进行集成。预计未来将在 NVIDIA NIM、Amazon SageMaker、Groq、Databricks 和 Snowflake 等平台上推出。

未来发展

Mistral AI 计划在未来几周内推出具备增强推理能力的更多模型。这些模型将补充现有的大型推理模型，并为进一步的发展提供坚实的基础。

Mistral Small 3 是高效、低延迟 AI 模型发展的一个重要进步。它将高性能、开源可用性和适用于广泛应用的特点相结合，使其成为 AI 领域的一个宝贵补充。无论是用于对话助手、特定领域的任务，还是本地推理，Mistral Small 3 都为开发者和企业提供了强大的工具。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送