Google DeepMind 发布 EmbeddingGemma:面向端侧的多语言开源向量模型(308M),小体量也能打
Google DeepMind 推出的开源多语言文本向量模型,主打端侧/离线场景,约 308M 参数,量化后可在 小于200MB内存 下运行,支持 RAG / 语义检索 / 分类 / 聚类 等。

EmbeddingGemma模型特点
EmbeddingGemma 是基于 Gemma 3 架构打造的全新开源多语言向量模型,专为移动端/本地离线应用而生。它以约 3.08亿参数的紧凑体量,在 RAG、语义搜索、分类、聚类等任务上提供高质量表征,同时将隐私与可用性拉满:无需联网即可在本地生成向量。
该模型基于100多种语言训练,这意味着支持大多数语种。最高输入为2K。
其核心亮点总结如下:
