Seed1.6-Embedding-1215
传闻Seed1.6-Embedding-1215
模型基本信息
开源和体验地址
官方介绍与博客
API接口信息
评测得分
发布机构
模型解读
模型定位与状态
Seed1.6-Embedding-1215 是一个以向量表示(embedding)为核心能力的模型名称标识。当前未检索到 ByteDance Seed 团队将“seed1.6-embedding-1215”作为独立版本对外发布的官方公告或公开模型卡页面;已确认的公开线索主要来自第三方公开评测提交与链接变更记录。
系列背景:Seed-1.6-Embedding(官方公开信息)
ByteDance Seed 团队在 2025-06-28 发布的官方博客中介绍了 Seed-1.6-Embedding:该模型基于 Seed1.6-Flash 构建,支持在文本、图像、视频之间进行混合检索(hybrid retrieval),并支持多种向量维度(2048、1024)。官方同时说明其 API 已在火山引擎方舟提供(Model ID:doubao-embedding-vision-250615)。
架构与训练方法(来自 Seed-1.6-Embedding 官方说明)
架构:官方描述其为双塔(dual-tower)结构,embedding 向量取自 [EOS] token 在最后一层的隐藏向量。
训练:官方描述采用三阶段训练:Stage 1 使用大规模纯文本数据进行对比学习(InfoNCE);Stage 2 使用规模达“数千万级”的图文对与视频文对数据进行多模态对齐训练(同样使用 InfoNCE);Stage 3 通过覆盖不同任务类型、模态与场景的数据进行微调,并使用指令化数据与难负样本挖掘等方式提升泛化。
公开评测提交中的版本线索(seed1.6-embedding-1215)
在 TIGER-Lab 的 MMEB Leaderboard 公开仓库中,存在 scores/seed1.6-embedding-1215.json 文件,其 metadata 记录:model_name=seed1.6-embedding-1215、embedding_dimension=2048、model_release_date=2025-12-15、max_length_tokens=null。该文件同时包含大量基准任务的检索指标(如 ImageNet-1K 的 hit@1=0.837 等)。
该文件最初给出的模型链接为 https://seed1-6-embedding-1215.github.io,后续更新为火山引擎方舟控制台的模型详情页(Id=doubao-embedding-vision)。由于控制台地址通常需要登录访问,公开网页侧无法直接确认其对外展示内容是否与“1215”后缀一一对应。
性能与基准(公开资料)
官方博客(Seed-1.6-Embedding):截至 2025-06-28,官方披露其在 CMTEB 纯文本任务得分 75.62;在 MMEB-V2 Image 榜单得分 77.78,并描述在新增 Video 榜单上同样领先。
公开评测提交(seed1.6-embedding-1215):MMEB Leaderboard 的提交文件提供了多数据集、多指标的明细结果,可用于复现或横向比对。
访问方式与许可
官方博客明确 Seed-1.6-Embedding 可通过火山引擎方舟 API 访问(Model ID:doubao-embedding-vision-250615)。关于“seed1.6-embedding-1215”是否为同一服务的后续版本或内部版本标记,当前缺少可公开验证的官方说明。
信息来源
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
