BAAI General Embedding - Large - en
BAAI General Embedding - Large - en 是由 北京智源人工智能研究院 发布的 AI 模型,发布时间为 2023-08-02,定位为 embedding模型,参数规模约为 0.0B,上下文长度为 1024,模型文件大小约 1.34GB,采用 MIT License 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
BAAI General Embedding是北京智源人工智能研究院开源的一系列embedding大模型,支持中文和英文的embedding。效果很好,重要的是免费商用授权!
BAAI General Embedding - large - en是其中的英文版本,参数也是最高的一类。不过官方并未透露其参数大小。该模型的维度是1024,最高支持输入的序列长度是512。在MTEB评分中超过了OpenAI的text-embedding-ada-002。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
