BAAI General Embedding - Large-EN-1.5
BAAI General Embedding - Large-EN-1.5 是由 北京智源人工智能研究院 发布的 AI 模型,发布时间为 2023-09-12,定位为 embedding模型,参数规模约为 3.26B,上下文长度为 512,模型文件大小约 1.34GB,采用 MIT License 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
北京智源人工智能研究院开源的向量大模型,bge-large-en-v1.5是其参数规模最大的一个,有3.26亿参数,英文版。完全开源。在MTEB和C-MTEB上得分都非常高。
1.5版本的bge-large-en-v1.5主要减轻了相似性分布问题,并加强了无需指令的检索能力。
该模型最高输入512个tokens,输出的向量维度是1024。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
