Qwen3-Embedding-8B

Name: Qwen3-Embedding-8B
Availability: InStock
Author: 阿里巴巴

embedding模型

Qwen3-Embedding-8B

Release date: 2025-06-05更新于: 2025-06-08 22:03:581,562

Live demo

Parameters

80.0亿

Context length

32K

Chinese support

Supported

Reasoning ability

Qwen3-Embedding-8B is an AI model published by 阿里巴巴, released on 2025-06-05, for embedding模型, with 80.0B parameters, and 32K tokens context length, requiring about 16GB storage, under the Apache 2.0 license.

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Qwen3-Embedding-8B

Model basics

Reasoning traces

Not supported

Thinking modes

Thinking modes not supported

Context length

32K tokens

Max output length

4096 tokens

Model type

embedding模型

Release date

2025-06-05

Model file size

16GB

MoE architecture

Total params / Active params

80.0B / N/A

Knowledge cutoff

No data

Qwen3-Embedding-8B

Open source & experience

Code license

Apache 2.0

Weights license

Apache 2.0- 免费商用授权

GitHub repo

GitHub link unavailable

Hugging Face

https://huggingface.co/Qwen/Qwen3-Embedding-8B

Live demo

No live demo

Qwen3-Embedding-8B

API details

API speed

4/5

No public API pricing yet.

Qwen3-Embedding-8B

Benchmark Results

Qwen3-Embedding-8B currently shows benchmark results led by MTEB (1 / 5, score 70.58). This page also consolidates core specs, context limits, and API pricing so you can evaluate the model from benchmark results and deployment constraints together.

文本向量检索

1 evaluations

Benchmark / mode

Score

Rank/total

MTEB

Off

70.58

1 / 5

View benchmark analysis Compare with other models

Qwen3-Embedding-8B

Publisher

阿里巴巴

View publisher details

Qwen3-Embedding-8B

Model Overview

Qwen3-Embedding-8B是阿里开源的80亿参数规模的向量大模型，支持100+多种语言。这是Qwen3 Embedding系列开源模型中的一员，该系列基于Qwen3基础模型开发，专为文本嵌入、检索和排序任务而设计。

Qwen3-Embedding-8B模型继承了其基础模型的多语言理解、长文本理解和推理能力。该模型拥有80亿参数，上下文长度为32k，嵌入维度最高可达4096，并支持用户自定义从32到4096的输出维度。

核心特性

模型架构与训练

Qwen3-Embedding-8B基于Qwen3基础模型，采用双编码器（dual-encoder）架构设计，并通过LoRA进行微调，以保留和增强基础模型的文本理解能力。该模型通过处理单个文本段落作为输入，并利用最后一个[EOS]标记对应的隐藏状态向量来提取语义表示。

其训练过程遵循一个三阶段范式：首先是使用大量弱监督数据进行对比预训练；第二阶段使用高质量的标记数据进行监督训练；最后阶段则通过合并策略整合多个候选模型以提升整体性能。

性能表现

Qwen3-Embedding-8B在多个基准测试中取得了领先的成绩。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

Model basics

Open source & experience

Official resources

API details

Benchmark Results

文本向量检索

Publisher

Model Overview

核心特性

模型架构与训练

性能表现

DataLearner 官方微信