StepFun Flash 3.5 是阶跃星辰(StepFun)于 2026 年 2 月最新发布的开源“轻量级”旗舰模型,专为智能体(Agent)场景与高并发应用设计。该模型在保持极低推理成本和极高响应速度的同时,具备比肩闭源大模型的逻辑推理与代码生成能力。
1. 模型简介与核心定位
- 发布机构:阶跃星辰 (StepFunAI)
- 发布时间:2026年2月2日
- 核心定位:该模型被称为 Agent 时代的“轻骑兵”,旨在解决传统大模型在复杂智能体交互中“速度慢”与“成本高”的痛点。它特别优化了指令遵循与工具调用能力,适合作为各类端侧应用与云端 Agent 的核心大脑。
2. 架构与技术规格
- 稀疏 MoE 架构:采用先进的混合专家(Mixture-of-Experts)设计,模型总参数量为 1960亿 (196B),但单次推理的激活参数量仅为 110亿 (11B)。这种设计在保证知识储备的同时,极大降低了计算负载。
- MTP-3 加速技术:引入了“多 Token 预测”(Multi-Token Prediction)技术,一次前向传播可预测 3 个 Token,使得推理速度最高可达 350 TPS,特别适合实时交互场景。
- 上下文窗口:原生支持 256K 超长上下文,结合滑动窗口与全局注意力机制,能够精准处理长文档分析与复杂的多轮对话历史。
3. 核心能力与支持模态
- 模态支持:支持文本输入/输出及代码生成(Text/Code)。虽为轻量版,但继承了 Step 系列的多模态理解基因,能高效处理结构化数据。
- 智能编程与可视化:在代码生成方面表现卓越,官方演示显示其仅凭自然语言描述即可编写并输出基于 WebGL 2.0 的高性能可视化程序。
- 复杂逻辑推理:在不依赖外部工具的情况下,能够快速完成等差数列求和、阶乘累加等高难度数学运算,逻辑性能显著优于同尺寸竞品。
4. 性能与基准评测
- Agent 能力:在复杂的端云协同任务中,表现出极强的任务拆解能力。例如将模糊的用户需求(如“对比全网价格”)自动拆解为具体的搜索、抓取与汇总子任务。
- 基准对比:在数学逻辑与代码编写的基准测试中,其得分足以媲美当前主流的闭源大模型,同时保持了开源模型的高可控性。
5. 应用场景与限制
- 推荐用例:实时对话机器人、代码辅助助手、复杂 Agent 工作流编排、端侧设备(如高配个人工作站)本地部署。
- 部署优势:官方已针对 NVIDIA DGX 及 Apple M4 Max 等硬件进行了专门优化,降低了本地部署门槛。
6. 访问方式与许可
- 开源许可:模型权重已在 Hugging Face 与 GitHub 上开源(Apache 2.0 协议)。
- API 访问:已上线 OpenRouter 及阶跃星辰开放平台,发布初期提供限免或低成本调用服务。