m3e-Large

Name: Moka Massive Mixed Embedding-Large
Author: Moka-AI

embedding模型m3e

Moka Massive Mixed Embedding-Large

发布时间: 2023-06-07更新于: 2023-08-08 17:29:44.455400

在线体验GitHub Hugging Face Compare

模型参数

3.4亿

上下文长度

512

中文支持

支持

推理能力

Moka Massive Mixed Embedding-Large 是由 Moka-AI 发布的 AI 模型，发布时间为 2023-06-07，定位为 embedding模型，参数规模约为 3.4亿，上下文长度为 512，模型文件大小约 1.3，采用开源不可商用许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

m3e-Large

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

512 tokens

最大输出长度

暂无数据

模型类型

embedding模型

输入/输出模态

文本 → 向量

发布时间

2023-06-07

模型文件大小

1.3

MoE架构

否

总参数 / 激活参数

3.4亿 / 不涉及

知识截止

暂无数据

m3e-Large

开源和体验地址

代码开源状态

开源不可商用

预训练权重开源

开源不可商用- 不可商用

GitHub 源码

https://github.com/Moka-AI

Hugging Face

https://huggingface.co/moka-ai/m3e-large

在线体验

暂无在线体验地址

m3e-Large

官方介绍与博客

官方论文

M3E Models

DataLearnerAI博客

暂无介绍博客

m3e-Large

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

m3e-Large

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

m3e-Large

发布机构

Moka-AI

查看发布机构详情

Moka Massive Mixed Embedding-Large

模型解读

M3E 是 Moka Massive Mixed Embedding 的缩写

Moka，此模型由 MokaAI 训练，开源和评测，训练脚本使用 uniem ，评测 BenchMark 使用 MTEB-zh
Massive，此模型通过千万级 (2200w+) 的中文句对数据集进行训练
Mixed，此模型支持中英双语的同质文本相似度计算，异质文本检索等功能，未来还会支持代码检索
Embedding，此模型是文本嵌入模型，可以将自然语言转换成稠密的向量

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送