Baichuan-M3-235B

Name: Baichuan-M3-235B
Author: 百川智能

聊天大模型

Baichuan-M3-235B

发布时间: 2026-01-13更新于: 2026-03-08 21:06:20457

在线体验GitHub Hugging Face Compare

模型参数

2350亿

上下文长度

暂无数据

中文支持

不支持

推理能力

Baichuan-M3-235B 是由百川智能发布的 AI 模型，发布时间为 2026-01-13，定位为聊天大模型，参数规模约为 2350亿，采用 Apache 2.0 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Baichuan-M3-235B

模型基本信息

推理过程

支持

思考模式

常规模式思考水平 · 扩展 (Extended)

上下文长度

暂无数据

最大输出长度

2K tokens

模型类型

聊天大模型

输入/输出模态

文本 → 文本

发布时间

2026-01-13

模型文件大小

暂无数据

MoE架构

是

总参数 / 激活参数

2350亿 / 不涉及

知识截止

暂无数据

Baichuan-M3-235B

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

https://github.com/baichuan-inc/Baichuan-M3-235B

Hugging Face

https://huggingface.co/baichuan-inc/Baichuan-M3-235B

在线体验

暂无在线体验地址

Baichuan-M3-235B

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

暂无介绍博客

Baichuan-M3-235B

API接口信息

接口速度

3/5

暂无公开的 API 定价信息。

Baichuan-M3-235B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Baichuan-M3-235B

发布机构

百川智能

查看发布机构详情

Baichuan-M3-235B

模型解读

模型简介

Baichuan-M3-235B 是百川智能（Baichuan Intelligence）最新一代医疗增强类大语言模型，紧随 Baichuan-M2 之后推出。目前该模型已在部分公开平台（如 Hugging Face）可见其模型卡信息，但官方技术文档尚未完全公开。模型设计围绕提高临床推理和医疗决策能力展开，尤其强调内在问诊推理路径建模。根据 TechWeb 报道，Baichuan-M3 在医疗基准 HealthBench 与 HealthBench-Hard 上显著优于前代和其它主流模型，并具备更低幻觉率和更高临床推理一致性。该模型目前已在 Hugging Face 上开放，并配有 README 与 quick start 信息，但截至目前尚无完整官方论文或技术报告。

架构与技术规格

Baichuan-M3-235B 是一个参数规模约 235B 的大语言模型（dense/未公开 MoE 分布），专注于医疗推理、临床问诊流程模拟与低幻觉表现。官方文档提及其采用 Fact-Aware 强化学习及细分流水线训练 (Segmented Pipeline Reinforcement) 等策略提升可靠性。

核心能力与支持模态

该模型主要针对医疗文本推理与诊断推理任务，未见官方指出支持其它模态输入，如图像或音频。

性能与基准评测

根据公开 Hugging Face 及 TechWeb 信息，Baichuan-M3 在权威医疗大模型评测 HealthBench 上取得领先成绩，并在复杂医疗决策子基准（HealthBench-Hard）中超越包括 GPT-5.2 在内的多个顶级模型。

访问方式与许可

模型代码与权重已托管在 Hugging Face 仓库，地址详见 huggingfaceUrl 字段。官方尚未发布对应的学术论文，但模型卡中有简要技术介绍。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送