BGE-Base-en - BAAI General Embedding - Base - en

模型详细情况和参数

BGE-Base-en

模型全称
BAAI General Embedding - Base - en
模型简称
BGE-Base-en
模型类型
embedding模型
发布日期
2023-08-02
预训练文件大小
438MB
是否支持中文(中文优化)
最高支持的上下文长度
512
模型参数数量(亿)
0
代码是否开源
MIT License
预训练结果是否开源
MIT License
预训练结果商用授权情况
免费商用授权
模型HuggingFace链接
https://huggingface.co/BAAI/bge-base-en
发布论文名(官方博客名)
Chinese Massive Text Embedding Benchmark
基础模型
无基础模型

BAAI General Embedding - Base - en 简介

BAAI General Embedding是北京智源人工智能研究院开源的一系列embedding大模型,支持中文和英文的embedding。效果很好,重要的是免费商用授权!


BAAI General Embedding - base - en是其中的英文版本,是一个中等规模参数的版本。不过官方并未透露其参数大小。该模型的维度是1024,最高支持输入的序列长度是512。在MTEB评分中超过了OpenAI的text-embedding-ada-002,但是比bge-large-en效果稍差( https://www.datalearner.com/ai-models/pretrained-models/bge-large-en )。

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

BGE-Base-en所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

BGE-Base-en相关的任务
文本嵌入

文本嵌入

Embedding

35个资源