Qwen-7B-Chat

Name: Qwen-7B-Chat
Author: 阿里巴巴

基础大模型Qwen

Qwen-7B-Chat

发布时间: 2023-08-03更新于: 2023-08-04 08:45:33.308602

在线体验GitHub Hugging Face Compare

模型参数

70亿

上下文长度

中文支持

支持

推理能力

Qwen-7B-Chat 是由阿里巴巴发布的 AI 模型，发布时间为 2023-08-03，定位为基础大模型，参数规模约为 70亿，上下文长度为 8K，模型文件大小约 15.4GB，采用 Tongyi Qianwen LICENSE AGREEMENT 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen-7B-Chat

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

8K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

暂无数据

发布时间

2023-08-03

模型文件大小

15.4GB

MoE架构

否

总参数 / 激活参数

70亿 / 不涉及

知识截止

暂无数据

Qwen-7B-Chat

开源和体验地址

代码开源状态

Tongyi Qianwen LICENSE AGREEMENT

预训练权重开源

Tongyi Qianwen LICENSE AGREEMENT- 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen-7B

Hugging Face

https://huggingface.co/Qwen/Qwen-7B-Chat

在线体验

暂无在线体验地址

Qwen-7B-Chat

官方介绍与博客

官方论文

通义千问

DataLearnerAI博客

暂无介绍博客

Qwen-7B-Chat

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

Qwen-7B-Chat

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Qwen-7B-Chat

发布机构

阿里巴巴

查看发布机构详情

Qwen-7B-Chat

模型解读

通义千问-7B（Qwen-7B）是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。

Qwen-7B-Chat是在在Qwen-7B的基础上，使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。

通义千问的评测效果也很好，超过了LLaMA2：

Model	MMLU	C-Eval	GSM8K	HumanEval	WMT22 (en-zh)
LLaMA-7B	35.1	-	11.0	10.5	8.7
LLaMA 2-7B	45.3	-	14.6	12.8	17.9
Baichuan-7B	42.3	42.8	9.7	9.2	26.6
ChatGLM2-6B	47.9	51.7	32.4	9.2	-
InternLM-7B	51.0	52.8	31.2	10.4	14.8
Baichuan-13B	51.6	53.6	26.6	12.8	30.0
LLaMA-13B	46.9	35.5	17.8	15.8	12.0
LLaMA 2-13B	54.8	-	28.7	18.3	24.2
ChatGLM2-12B	56.2	61.6	40.9	-	-
Qwen-7B	56.7	59.6	51.6	24.4	30.6

从上图的评测中可以看到，阿里通义千问在MMLU得分第一，超过了LLaMA2系列模型，而其他方面的得分也很高。最重要的是这个模型中文支持良好，开源免费商用！

Qwen-7B-Chat版本的基础模型是Qwen-7B，模型信息卡： https://www.datalearner.com/ai-models/pretrained-models/Qwen-7B

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送