BG

BGE-M3-Embedding-Unsupervised

embedding模型M3

BGE-M3-Embedding-Unsupervised

发布时间: 2024-01-30更新于: 2024-02-01 15:35:55.548849
模型参数
1.1亿
上下文长度
8K
中文支持
支持
推理能力

BGE-M3-Embedding-Unsupervised 是由 北京智源人工智能研究院 发布的 AI 模型,发布时间为 2024-01-30,定位为 embedding模型,参数规模约为 1.1亿,上下文长度为 8K,模型文件大小约 2.27GB,采用 MIT License 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

BGE-M3-Embedding-Unsupervised

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
8K tokens
最大输出长度
暂无数据
模型类型
embedding模型
输入/输出模态
文本 → 向量
发布时间
2024-01-30
模型文件大小
2.27GB
MoE架构
总参数 / 激活参数
1.1亿 / 不涉及
知识截止
暂无数据
BGE-M3-Embedding-Unsupervised

开源和体验地址

代码开源状态
预训练权重开源
MIT License- 免费商用授权
在线体验
暂无在线体验地址
BGE-M3-Embedding-Unsupervised

官方介绍与博客

BGE-M3-Embedding-Unsupervised

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
BGE-M3-Embedding-Unsupervised

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

BGE-M3-Embedding-Unsupervised

发布机构

北京智源人工智能研究院
查看发布机构详情
BGE-M3-Embedding-Unsupervised

模型解读

BGE-M3-Embedding是北京智源人工智能研究院开源的一个最新的Embedding大模型,最大的特点是功能很多,体现在三个层面,包括支持100多种语言、支持短句到长文(最高8K输入)、以及支持多种不同的功能。


BGE-M3-Embedding有2个版本,一个是在大量数据做 contrastive learning之后得到的一个无监督版本(bge-m3-unsupervised),就是本模型。还有一个微调版本,参考: https://www.datalearner.com/ai-models/pretrained-models/BGE-M3-Embedding 

    DataLearner 官方微信

    欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

    DataLearner 官方微信二维码