Seed-1.6-Embedding-250615
Seed-1.6-Embedding-250615
模型基本信息
开源和体验地址
官方介绍与博客
API接口信息
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | $0.125 | -- |
| 图片 | $0.325 | -- |
| Embedding | -- | $0 |
评测得分
发布机构
模型解读
概述
Seed-1.6-Embedding 是字节跳动 Seed 团队在 2025-06-28 公布的一款向量模型,用于将内容编码为向量表示,面向检索、匹配、分类等场景。官方文章同时给出该模型在火山引擎的 API Model ID 为 doubao-embedding-vision-250615。
命名与版本对应关系
在 BytePlus ModelArk 文档中,该模型以 embedding-vision 作为推荐模型条目,并列出多个版本号。ModelArk 版本号 embedding-vision-250615 对应本条目(250615)。
版本能力差异(250615 vs 250328)
- 250615:支持 视频、图片、文本 输入;最大上下文长度为 128K;最大向量维度 2048,并支持降维到 1024。
- 250328:仅支持最多 1 张图片 + 1 段文本 输入;最大上下文长度为 8K;最大向量维度 2048。
架构与向量抽取
官方文章描述该模型基于 Seed1.6-Flash,并采用双塔(dual-tower)结构;向量抽取为最后一层隐藏层中与 [EOS] token 对应的向量表示。
训练方法(公开披露)
官方文章将训练过程描述为三阶段:文本继续训练、多模态继续训练、以及微调。训练目标包含从 VLM 基座获得 embedding 能力、多模态(图像/视频与文本)对齐,以及面向多任务/多场景的数据构建与训练。
评测与公开结果(截至 2025-06-28)
官方文章披露:在 C-MTEB(中文)榜单上报告得分 75.62;在 MMEB-V2 Image 榜单上报告得分 77.78,并披露与第二名的差值;同时披露在 MMEB-V2 Video 榜单上也取得领先差值(以官方图表与文字为准)。
上下文与模态
BytePlus ModelArk 文档描述 embedding-vision 支持中英文,并支持文本、图像、视频等混合输入;其中 250615 及后续版本支持视频输入,并给出最大上下文长度为 128K(250615)/ 8K(其他版本)。
访问方式与计费(文档披露)
BytePlus ModelArk 文档给出按 token 计费:文本输入 0.125 USD/百万 tokens、图片输入 0.325 USD/百万 tokens、输出 0;缓存命中与缓存存储标注为“不涉及”。文档未在该条目中单列视频输入价格。
开源与许可
上述官方发布文章与 ModelArk 文档未提供可下载权重或开源仓库地址;该模型以在线服务形式提供访问。
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
