SE

Seed-1.6-Embedding-250615

Seed-1.6-Embedding-250615

发布时间: 2025-06-288
模型参数
未披露
上下文长度
128K
中文支持
支持
推理能力

模型基本信息

推理过程
不支持
上下文长度
128K tokens
最大输出长度
暂无数据
模型类型
暂无数据
发布时间
2025-06-28
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
0.0 亿 / 不涉及
知识截止
暂无数据
推理模式
常规模式(Non-Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址

官方介绍与博客

DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.125--
图片$0.325--
Embedding--$0

评测得分

图像向量嵌入

共 1 项评测
评测名称 / 模式
得分
排名/总数
77.78
3 / 6

发布机构

字节跳动Seed团队
查看发布机构详情

模型解读

概述

Seed-1.6-Embedding 是字节跳动 Seed 团队在 2025-06-28 公布的一款向量模型,用于将内容编码为向量表示,面向检索、匹配、分类等场景。官方文章同时给出该模型在火山引擎的 API Model ID 为 doubao-embedding-vision-250615

命名与版本对应关系

在 BytePlus ModelArk 文档中,该模型以 embedding-vision 作为推荐模型条目,并列出多个版本号。ModelArk 版本号 embedding-vision-250615 对应本条目(250615)。

版本能力差异(250615 vs 250328)

  • 250615:支持 视频、图片、文本 输入;最大上下文长度为 128K;最大向量维度 2048,并支持降维到 1024
  • 250328:仅支持最多 1 张图片 + 1 段文本 输入;最大上下文长度为 8K;最大向量维度 2048

架构与向量抽取

官方文章描述该模型基于 Seed1.6-Flash,并采用双塔(dual-tower)结构;向量抽取为最后一层隐藏层中与 [EOS] token 对应的向量表示。

训练方法(公开披露)

官方文章将训练过程描述为三阶段:文本继续训练、多模态继续训练、以及微调。训练目标包含从 VLM 基座获得 embedding 能力、多模态(图像/视频与文本)对齐,以及面向多任务/多场景的数据构建与训练。

评测与公开结果(截至 2025-06-28)

官方文章披露:在 C-MTEB(中文)榜单上报告得分 75.62;在 MMEB-V2 Image 榜单上报告得分 77.78,并披露与第二名的差值;同时披露在 MMEB-V2 Video 榜单上也取得领先差值(以官方图表与文字为准)。

上下文与模态

BytePlus ModelArk 文档描述 embedding-vision 支持中英文,并支持文本、图像、视频等混合输入;其中 250615 及后续版本支持视频输入,并给出最大上下文长度为 128K(250615)/ 8K(其他版本)。

访问方式与计费(文档披露)

BytePlus ModelArk 文档给出按 token 计费:文本输入 0.125 USD/百万 tokens、图片输入 0.325 USD/百万 tokens、输出 0;缓存命中与缓存存储标注为“不涉及”。文档未在该条目中单列视频输入价格。

开源与许可

上述官方发布文章与 ModelArk 文档未提供可下载权重或开源仓库地址;该模型以在线服务形式提供访问。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码