加载中...
加载中...
Seed-OSS-36B
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
2025 年 8 月 20 日,字节跳动旗下 Seed 团队正式开源了 Seed-OSS-36B 系列模型,并在 Hugging Face 与 GitHub 提供了代码、配置与文档。此次开源覆盖了 Base、Base-woSyn 和 Instruct 三个版本,许可协议为 Apache-2.0。这一系列模型的定位是通用大语言模型,支持长上下文、推理、Agent 场景,并引入了“思考预算(thinking budget)”机制以控制推理成本 。
Seed-OSS-36B 在架构和能力上有以下特点:
在版本划分上:
此外,模型内置了 “思考预算”机制,允许调用者设置推理链条的长度,例如 512、1K、2K tokens。当预算为 0 时模型直接回答,为 -1 时则不限预算。该机制有助于在复杂推理与性能成本之间进行权衡 。
根据官方模型卡与复现实验,Seed-OSS-36B 在多项基准任务上给出了数据:
需要注意,官方表格包含了“报告值”和“复现值”,在不同对比中应区分来源。
从开源定位与技术实现来看,Seed-OSS-36B 具有以下几个值得关注的点:
📌 总结来看,Seed-OSS-36B 是一款定位清晰的开源大模型系列,在长上下文和推理预算方面提供了新的思路,其分版本设计也为研究和应用提供了灵活空间。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
