DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Page navigation
目录
Model catalogQwen3-Embedding-8B
QW

Qwen3-Embedding-8B

Qwen3-Embedding-8B

Release date: 2025-06-05更新于: 2025-06-08 22:03:581,361
Live demoGitHubHugging FaceCompare
Parameters
80.0亿
Context length
32K
Chinese support
Supported
Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Qwen3-Embedding-8B

Model basics

Reasoning traces
Not supported
Context length
32K tokens
Max output length
4096 tokens
Model type
embedding模型
Release date
2025-06-05
Model file size
16GB
MoE architecture
No
Total params / Active params
80.0B / N/A
Knowledge cutoff
No data
Inference modes
No mode data
Qwen3-Embedding-8B

Open source & experience

Code license
Apache 2.0
Weights license
Apache 2.0- 免费商用授权
GitHub repo
GitHub link unavailable
Hugging Face
https://huggingface.co/Qwen/Qwen3-Embedding-8B
Live demo
No live demo
Qwen3-Embedding-8B

Official resources

Paper
Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models
DataLearnerAI blog
向量大模型新选择,阿里开源向量大模型Qwen-Embedding和重排序大模型Qwen-Reranker,开源向量检索能力第一名!完全免费开源。
Qwen3-Embedding-8B

API details

API speed
4/5
No public API pricing yet.
Qwen3-Embedding-8B

Benchmark Results

文本向量检索

1 evaluations
Benchmark / mode
Score
Rank/total
MTEBNormal
70.58
1 / 5
查看评测深度分析与其他模型对比
Qwen3-Embedding-8B

Publisher

阿里巴巴
阿里巴巴
View publisher details
Qwen3-Embedding-8B

Model Overview

Qwen3-Embedding-8B是阿里开源的80亿参数规模的向量大模型,支持100+多种语言。这是Qwen3 Embedding系列开源模型中的一员,该系列基于Qwen3基础模型开发,专为文本嵌入、检索和排序任务而设计。


Qwen3-Embedding-8B模型继承了其基础模型的多语言理解、长文本理解和推理能力。该模型拥有80亿参数,上下文长度为32k,嵌入维度最高可达4096,并支持用户自定义从32到4096的输出维度。


核心特性

      模型架构与训练

      Qwen3-Embedding-8B基于Qwen3基础模型,采用双编码器(dual-encoder)架构设计,并通过LoRA进行微调,以保留和增强基础模型的文本理解能力。该模型通过处理单个文本段落作为输入,并利用最后一个[EOS]标记对应的隐藏状态向量来提取语义表示。


      其训练过程遵循一个三阶段范式:首先是使用大量弱监督数据进行对比预训练;第二阶段使用高质量的标记数据进行监督训练;最后阶段则通过合并策略整合多个候选模型以提升整体性能。


      性能表现


      Qwen3-Embedding-8B在多个基准测试中取得了领先的成绩。

          DataLearner 官方微信

          欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

          DataLearner 官方微信二维码