BGE-M3-Embedding-Unsupervised
BGE-M3-Embedding-Unsupervised is an AI model published by 北京智源人工智能研究院, released on 2024-01-30, for embedding模型, with 1.13B parameters, and 8K tokens context length, requiring about 2.27GB storage, under the MIT License license.
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
BGE-M3-Embedding是北京智源人工智能研究院开源的一个最新的Embedding大模型,最大的特点是功能很多,体现在三个层面,包括支持100多种语言、支持短句到长文(最高8K输入)、以及支持多种不同的功能。
BGE-M3-Embedding有2个版本,一个是在大量数据做 contrastive learning之后得到的一个无监督版本(bge-m3-unsupervised),就是本模型。还有一个微调版本,参考: https://www.datalearner.com/ai-models/pretrained-models/BGE-M3-Embedding
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
