M3

m3e-Large

embedding模型m3e

Moka Massive Mixed Embedding-Large

发布时间: 2023-06-07更新于: 2023-08-08 17:29:44.455400
模型参数
3.4亿
上下文长度
512
中文支持
支持
推理能力

Moka Massive Mixed Embedding-Large 是由 Moka-AI 发布的 AI 模型,发布时间为 2023-06-07,定位为 embedding模型,参数规模约为 3.4亿,上下文长度为 512,模型文件大小约 1.3,采用 开源不可商用 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

m3e-Large

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
512 tokens
最大输出长度
暂无数据
模型类型
embedding模型
输入/输出模态
文本 → 向量
发布时间
2023-06-07
模型文件大小
1.3
MoE架构
总参数 / 激活参数
3.4亿 / 不涉及
知识截止
暂无数据
m3e-Large

开源和体验地址

代码开源状态
开源不可商用
预训练权重开源
开源不可商用- 不可商用
在线体验
暂无在线体验地址
m3e-Large

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客
m3e-Large

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
m3e-Large

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

m3e-Large

发布机构

Moka Massive Mixed Embedding-Large

模型解读

M3E 是 Moka Massive Mixed Embedding 的缩写

  • Moka,此模型由 MokaAI 训练,开源和评测,训练脚本使用 uniem ,评测 BenchMark 使用 MTEB-zh
  • Massive,此模型通过千万级 (2200w+) 的中文句对数据集进行训练
  • Mixed,此模型支持中英双语的同质文本相似度计算,异质文本检索等功能,未来还会支持代码检索
  • Embedding,此模型是文本嵌入模型,可以将自然语言转换成稠密的向量

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码