字节跳动Seed团队

字节跳动Seed团队

Organization profile and published models

seed.bytedance.com/en

About this organization

字节跳动 Seed 团队介绍

更新时间:2026 年 6 月 机构类型:企业 AI 基础模型研究团队 所属公司:字节跳动 主要方向:大语言模型、多模态模型、视频生成、图像生成、语音交互、AI Agent、AI Infra、AI for Science、机器人与具身智能

机构简介

字节跳动 Seed 团队是字节跳动面向通用人工智能与基础模型方向组建的核心 AI 研究团队,成立于 2023 年。团队目标是探索通用智能的新方法,持续提升模型智能上限,并将基础模型能力应用到真实产品与大规模用户场景中。

截至 2026 年,Seed 已不再只是单一的大语言模型团队,而是扩展为覆盖基础模型、多模态理解与生成、语音交互、视频生成、3D 生成、AI Agent、AI Infra、AI for Science、机器人与 Responsible AI 的综合性 AI 研究组织。其技术成果已经支撑字节跳动旗下多个产品和业务场景,包括豆包、扣子、即梦等应用。

Seed 团队的定位可以概括为:以基础模型为底座,以多模态与 Agent 能力为核心增长方向,以大规模产品落地为验证场景,同时保持对长期 AGI 路径、模型架构、训练系统和世界模型的探索。

研究方向

Seed 团队的研究方向较为完整,既覆盖模型算法,也覆盖训练系统和产品化能力。

1. 大语言模型与 Agent

Seed LLM 方向聚焦下一代大语言模型,研究内容包括预训练、后训练、推理能力、长上下文、模型记忆、可解释性、推理加速、工具使用和 Agent 能力。近年来,Seed 的通用模型路线逐渐从传统聊天模型扩展到可执行复杂任务的 Agent 模型,例如支持搜索、代码执行、GUI 操作、多轮任务规划和长链路推理的模型体系。

代表模型包括 Seed1.8、Seed2.0、Seed-OSS-36B、Seed-Thinking-v1.5 等。

2. 多模态理解与世界模型

Seed 的多模态方向强调统一理解与生成能力,覆盖图像、视频、音频、文本、GUI、3D 空间和虚拟/真实环境交互。该方向的目标不是单纯提升视觉问答能力,而是构建能够理解世界、生成内容、操作界面并参与复杂任务的多模态基础模型。

代表成果包括 Seed1.5-VL、BAGEL、Seed3D 2.0、Depth Anything 3 等。

3. 图像、视频与 3D 生成

Seed 在视觉生成方向形成了较完整的产品线,包括图像生成与编辑、视频生成、音视频联合生成和 3D 内容生成。

其中,Seedance 系列聚焦视频与音视频生成,Seedream 系列聚焦图像生成,SeedEdit 聚焦自然语言图像编辑,Seed3D 聚焦高质量 3D 内容生成。这些模型面向创意生产、短视频、广告、电商、游戏、3D 资产和具身智能等场景。

4. 语音与实时交互

Seed Speech 方向聚焦语音、音频、音乐、自然语言理解与多模态深度学习。相比传统语音识别、语音合成或半双工语音助手,Seed 的新方向更强调端到端、多模态、实时、自然的语音交互。

代表模型包括 Seeduplex、Seed LiveInterpret、Seed-Music 等。其中 Seeduplex 是面向实时语音对话的全双工语音大模型,强调“边听边说”、抗干扰、端点判断和更自然的对话节奏。

5. AI 基础设施

Seed Infrastructures 方向负责支撑基础模型研发所需的底层系统能力,包括分布式训练、强化学习框架、高性能推理、异构硬件编译、训练稳定性、推理调度和硬件协同优化。

该方向对 Seed 的重要性很高,因为大模型竞争不只取决于算法,也取决于能否稳定、高效、低成本地完成大规模训练、后训练和在线推理。

6. AI for Science

Seed 的 AI for Science 方向聚焦科学计算范式创新,重点包括生物基础模型、蛋白质与分子结构预测、量子化学、分子动力学和材料/药物发现等方向。

代表成果包括 Protenix 等生物分子基础模型,以及面向量子化学和分子模拟的研究工作。

7. 机器人与具身智能

Seed Robotics 方向关注通用智能机器人,研究内容包括机器人基础模型、视觉-语言-动作模型、机器人感知、灵巧操作、强化学习、机器人数据引擎和真实环境交互。

代表成果包括 Seed GR-RL、Seed GR-3、ByteDexter 等。该方向说明 Seed 已经将基础模型能力从文本和多模态内容生成进一步扩展到真实世界操作和具身智能。

8. Responsible AI

Seed Responsible AI 方向关注 AI 安全、可靠性、可持续性和可信机制研究。其研究不仅包括安全评估,也包括面向 Agent 的长期记忆、任务相关记忆选择、论文搜索智能体等方向。

代表成果包括 PaSa(Paper Search Agent)和 TaskMem 等。

代表模型与项目

Seed2.0

Seed2.0 是 Seed 在 2026 年推出的新一代基础模型系列,面向大规模生产部署和复杂真实任务。该系列包括 Pro、Lite、Mini 三类通用 Agent 模型,以及专用 Code 模型。

Seed2.0 的重点能力包括:

  • 更强的多模态理解能力,覆盖图像、视频、音频和文本;
  • 更强的复杂指令执行、长链路推理和多步任务处理能力;
  • 面向 Agent 工作流优化,支持计划、执行、反思和工具编排;
  • 提供不同规模模型,以平衡性能、成本、延迟和部署密度;
  • Seed2.0 Lite 在 2026 年 4 月底升级后,进一步增强了音频输入和全模态理解能力。

Seed2.0 标志着 Seed 的基础模型路线从“通用对话与多模态理解”进一步转向“面向真实任务执行的 Agent 基础模型”。

Seed1.8

Seed1.8 是面向真实世界 Agent 能力的基础模型,支持文本和图像输入,并强调多轮交互、搜索、代码生成与执行、GUI 理解和多步任务执行。

相比传统聊天模型,Seed1.8 更关注“模型如何在环境中完成任务”。它通过统一的 Agent 交互接口,将感知、推理和行动整合到同一个模型体系中,适合用于研究型任务、代码任务、视觉界面操作和复杂工具调用场景。

Seed-OSS-36B

Seed-OSS-36B 是 Seed 面向开源社区发布的大语言模型系列,参数规模为 36B。该系列采用 Apache-2.0 协议开源,支持原生 512K 长上下文,并强调推理、Agent、长文本处理和开发者友好能力。

Seed-OSS-36B 包括:

  • Seed-OSS-36B-Base;
  • Seed-OSS-36B-Base-woSyn;
  • Seed-OSS-36B-Instruct。

其中,Base-woSyn 版本降低了合成指令数据对预训练研究的干扰,更适合研究者进行后训练、对齐和基础模型研究;Instruct 版本则面向指令跟随、推理、代码和 Agent 任务。

Seed-Coder

Seed-Coder 是 Seed 开源的代码模型系列,模型规模为 8B,包含 base、instruct 和 reasoning 版本。该项目的重点不仅是模型本身,还包括一套由大语言模型参与的数据筛选和代码预训练数据构建流程。

Seed-Coder 的发布说明 Seed 团队在代码智能方向不仅关注模型效果,也关注如何用模型自动化构建高质量训练数据,从而降低人工数据治理成本。

BAGEL

BAGEL 是 Seed 开源的统一多模态模型,支持多模态理解与生成。它将文本、图像、视频和网页等多源交错数据纳入统一预训练框架,具备图像理解、图像生成、图像编辑、风格转换、未来帧预测、3D 操作和世界导航等能力。

BAGEL 是 Seed 在“理解与生成统一建模”方向的重要探索,也体现了 Seed 对多模态基础模型长期路线的判断:未来模型不应只是单点完成识别、问答或生成,而应在同一架构下同时具备理解、生成和交互能力。

Seed1.5-VL

Seed1.5-VL 是 Seed 的视觉语言基础模型,面向通用多模态理解和推理任务。它在视觉推理、图像问答、图表理解、视觉定位、计数、视频理解和 GUI Agent 等任务上表现突出。

Seed1.5-VL 的意义在于,它将多模态模型从“看图回答问题”推进到更复杂的视觉推理、界面理解和 Agent 控制场景。

Seedance 2.0

Seedance 2.0 是 Seed 的新一代视频生成模型,采用统一的多模态音视频联合生成架构,支持文本、图像、音频、视频等多种输入形式。

相比早期视频生成模型,Seedance 2.0 更强调复杂运动、物理一致性、主体一致性、音画同步和可控编辑能力。它支持多模态素材作为参考,例如图像、视频片段、音频和自然语言指令,适用于短视频创作、广告创意、影视预演和高质量内容生产。

Seedream 5.0 Lite

Seedream 5.0 Lite 是 Seed 的统一多模态图像生成模型,具备更强的理解、推理和生成能力,并加入在线搜索能力。它面向专业视觉创意场景,强调文字指令遵循、风格控制、构图能力、细节一致性和热点内容可视化。

Seeduplex

Seeduplex 是 Seed 推出的全双工语音大模型,面向更自然的实时语音交互。它区别于传统“用户说完—系统再答”的半双工交互方式,能够在听取用户语音的同时理解环境、判断是否打断、过滤干扰并控制回复节奏。

这一方向体现了 Seed 对下一代 AI 交互形态的判断:语音助手不应只是语音版聊天机器人,而应具备更接近真人对话的实时理解和互动能力。

Seed3D 2.0

Seed3D 2.0 是 Seed 的 3D 生成模型,重点提升几何精度、材质质量和下游可用性。它面向高质量 3D 内容生成、仿真、工业制造、游戏资产、机器人和具身智能等场景。

相比单纯生成“看起来像 3D”的模型,Seed3D 2.0 更强调几何结构、PBR 材质、可编辑性和仿真可用性。

Depth Anything 3

Depth Anything 3 是 Seed 发布的开源视觉空间重建模型,使用更简洁的单 Transformer 架构和统一的 depth-ray 表示,将单目深度估计扩展到任意视角的空间重建任务。该项目体现了 Seed 在视觉空间智能和 3D 感知方向的研究积累。

长期研究计划:Seed Edge

Seed Edge 是 Seed 团队发起的长期研究计划,目标是探索通用智能的新方法,并以更长周期支持高不确定性、高风险但可能具有突破性的 AI 研究课题。

该计划强调跨模态、跨方向合作,关注推理能力边界、感知能力边界、软硬一体模型设计、下一代学习范式和新的 scaling 路径。Seed Edge 的出现说明,Seed 不仅关注短期模型迭代和产品落地,也在尝试建立更长期的 AGI 研究机制。

开源生态与开发者资源

Seed 当前已经形成较清晰的外部开发者生态,主要包括:

  • ByteDance Seed 官方网站;
  • ByteDance-Seed GitHub 组织;
  • ByteDance-Seed Hugging Face 组织;
  • Seed-OSS、Seed-Coder、BAGEL、Depth Anything 3、Seed1.5-VL 等开源项目;
  • 火山引擎/方舟平台上的部分模型 API;
  • 面向研究者和学生的 Top Seed 人才计划。

从开源策略看,Seed 并不是将所有旗舰模型完全开源,而是采取“闭源旗舰模型 + 开源研究模型 + 开源工具链/数据方法”的组合策略。一方面,Seed2.0、Seedance 2.0、Seedream 等核心能力更多服务于产品和平台;另一方面,Seed-OSS、BAGEL、Seed-Coder、Depth Anything 3 等项目则用于吸引开发者、研究者和开源社区参与。

团队特点

Seed 团队的特点可以概括为以下几点:

  1. 模型谱系完整:从 LLM、VLM、视频、图像、语音、3D 到机器人,Seed 已经形成多条基础模型产品线。
  2. 重视真实场景验证:Seed 的模型能力不仅停留在论文和榜单,也通过豆包、扣子、即梦等产品进行大规模应用验证。
  3. Agent 化趋势明显:从 Seed1.8 到 Seed2.0,Seed 正在将模型能力从问答和生成推进到搜索、代码执行、GUI 操作和复杂任务执行。
  4. 多模态生成能力突出:Seedance、Seedream、SeedEdit、Seed3D 和 BAGEL 共同构成了 Seed 在视觉生成和统一多模态建模上的技术矩阵。
  5. 基础设施投入较深:Seed 不只做模型,也投入分布式训练、RL 系统、推理优化和异构硬件编译等 AI Infra。
  6. 长期 AGI 研究与短期产品落地并行:Seed Edge 代表长期探索,豆包等应用代表产品落地,两者共同构成 Seed 的发展路径。

发展时间线

  • 2023 年:字节跳动成立 Seed 团队,开始系统投入基础模型研发。
  • 2025 年 1 月:Seed Edge 长期研究计划启动,聚焦通用智能长期探索。
  • 2025 年 4 月:Seed-Thinking-v1.5 技术细节公布,展示 Seed 在推理模型方向的进展。
  • 2025 年 5 月:Seed-Coder、BAGEL、Seed1.5-VL 等模型和项目陆续发布,Seed 的代码、多模态和视觉语言模型能力集中对外展示。
  • 2025 年 8 月:Seed-OSS-36B 开源,提供 36B、512K 上下文的大语言模型系列。
  • 2025 年 11 月:Depth Anything 3 发布,展示 Seed 在空间重建和视觉基础模型方向的进展。
  • 2025 年 12 月:Seed1.8 发布,强调真实世界 Agent 能力。
  • 2026 年 2 月:Seed2.0 与 Seedance 2.0 发布,Seed 的模型路线进一步转向复杂任务执行和统一音视频生成。
  • 2026 年 4 月:Seeduplex、Seed3D 2.0、Seedream 5.0 Lite 等模型更新,Seed 在语音、3D 和图像生成方向继续扩展。
  • 2026 年 4 月底:Seed2.0 Lite 升级为更强的全模态理解模型,增强音频输入、Agent、Coding 和 GUI 能力。

总结

字节跳动 Seed 团队已经从早期的豆包大模型研发团队,发展为覆盖基础模型、多模态生成、语音交互、Agent、AI Infra、AI for Science 和机器人方向的综合 AI 研究组织。

如果说 2023—2024 年的 Seed 主要任务是追赶和建立基础模型能力,那么 2025—2026 年的 Seed 已经进入体系化扩张阶段:一方面通过 Seed2.0、Seedance 2.0、Seedream、Seeduplex 等模型服务字节跳动内部和外部应用场景;另一方面通过 Seed-OSS、BAGEL、Seed-Coder、Depth Anything 3 等项目参与开源生态与研究社区竞争。

从发展趋势看,Seed 的核心战略正在从“发布单个大模型”转向“构建多模态、可执行、可交互、可落地的基础模型体系”。这使其成为中国乃至全球 AI 基础模型竞争中值得持续关注的重要团队之一。

Product line release timeline

Generational evolution by product line · dot = one model release · dashed line connects successive generations · hover for details

Models
12
Time span
277days
Avg. gap
25days

Published models

15 models across 6 categories

Models published by 字节跳动Seed团队, grouped by category.

Seed 2.0

Multimodal models1Reasoning models1
First
2026-02
Latest
2026-02
Span
-
Models
2

Seed-1.6

Embedding models2
First
2025-03-28
Latest
2025-06-28
Span
93 days
Models
2