加载中...
加载中...
Voxtral-Mini-3B-2507
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
Voxtral Mini 1.0 (3B) 是 MistralAI 开源的轻量级语音识别模型,参数规模为 30 亿,基于 Ministral-3B 语言模型扩展音频能力开发而成。作为 Voxtral 系列成员(另含 240 亿参数的 Small 24B 版本),该模型专注为边缘设备与低成本场景提供高效的语音转录、翻译及语义理解功能。
项目说明
推理框架推荐使用 vLLM:
• 对话理解:temperature=0.2, top_p=0.95
• 语音转录:temperature=0.0
输入支持单消息多音频、多轮音频对话
API 成本$0.001/分钟(宣称成本为 Whisper 的一半)
开源协议Apache 2.0(Hugging Face 下载)
Voxtral Mini 3B 以 30 亿参数轻量化架构实现语音-文本一体化处理,在边缘设备与低成本场景中提供:
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

| Modality | Input | Output |
|---|---|---|
| Text | $0.04 | $0.04 |
| Audio | $0.001 | -- |