BGE-Large-en - BAAI General Embedding - Large - en

模型详细情况和参数

BGE-Large-en

模型全称
BAAI General Embedding - Large - en
模型简称
BGE-Large-en
模型类型
embedding模型
发布日期
2023-08-02
预训练文件大小
1.34GB
是否支持中文(中文优化)
最高支持的上下文长度
1024
模型参数数量(亿)
0
代码是否开源
MIT License
预训练结果是否开源
MIT License
预训练结果商用授权情况
免费商用授权
发布论文名(官方博客名)
Chinese Massive Text Embedding Benchmark
基础模型
无基础模型

BAAI General Embedding - Large - en 简介

BAAI General Embedding是北京智源人工智能研究院开源的一系列embedding大模型,支持中文和英文的embedding。效果很好,重要的是免费商用授权!


BAAI General Embedding - large - en是其中的英文版本,参数也是最高的一类。不过官方并未透露其参数大小。该模型的维度是1024,最高支持输入的序列长度是512。在MTEB评分中超过了OpenAI的text-embedding-ada-002。

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

BGE-Large-en所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

BGE-Large-en相关的任务
文本嵌入

文本嵌入

Embedding

35个资源