Seed-OSS-36B
Seed-OSS-36B is an AI model published by 字节跳动Seed团队, released on 2025-08-20, for 基础大模型, with 360.0B parameters, and 512K tokens context length, requiring about 72GB storage, under the Apache 2.0 license.
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
2025 年 8 月 20 日,字节跳动旗下 Seed 团队正式开源了 Seed-OSS-36B 系列模型,并在 Hugging Face 与 GitHub 提供了代码、配置与文档。此次开源覆盖了 Base、Base-woSyn 和 Instruct 三个版本,许可协议为 Apache-2.0。这一系列模型的定位是通用大语言模型,支持长上下文、推理、Agent 场景,并引入了“思考预算(thinking budget)”机制以控制推理成本 。
Seed-OSS-36B 在架构和能力上有以下特点:
在版本划分上:
此外,模型内置了 “思考预算”机制,允许调用者设置推理链条的长度,例如 512、1K、2K tokens。当预算为 0 时模型直接回答,为 -1 时则不限预算。该机制有助于在复杂推理与性能成本之间进行权衡 。
根据官方模型卡与复现实验,Seed-OSS-36B 在多项基准任务上给出了数据:
需要注意,官方表格包含了“报告值”和“复现值”,在不同对比中应区分来源。
从开源定位与技术实现来看,Seed-OSS-36B 具有以下几个值得关注的点:
📌 总结来看,Seed-OSS-36B 是一款定位清晰的开源大模型系列,在长上下文和推理预算方面提供了新的思路,其分版本设计也为研究和应用提供了灵活空间。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
