BAAI General Embedding - Base - en
BAAI General Embedding - Base - en is an AI model published by 北京智源人工智能研究院, released on 2023-08-02, for embedding模型, with 0.0B parameters, and 512 tokens context length, requiring about 438MB storage, under the MIT License license.
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
BAAI General Embedding是北京智源人工智能研究院开源的一系列embedding大模型,支持中文和英文的embedding。效果很好,重要的是免费商用授权!
BAAI General Embedding - base - en是其中的英文版本,是一个中等规模参数的版本。不过官方并未透露其参数大小。该模型的维度是1024,最高支持输入的序列长度是512。在MTEB评分中超过了OpenAI的text-embedding-ada-002,但是比bge-large-en效果稍差( https://www.datalearner.com/ai-models/pretrained-models/bge-large-en )。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
