QW

Qwen-7B-Chat

基础大模型Qwen

Qwen-7B-Chat

发布时间: 2023-08-03更新于: 2023-08-04 08:45:33.308598
模型参数
70亿
上下文长度
8K
中文支持
支持
推理能力

Qwen-7B-Chat 是由 阿里巴巴 发布的 AI 模型,发布时间为 2023-08-03,定位为 基础大模型,参数规模约为 70亿,上下文长度为 8K,模型文件大小约 15.4GB,采用 Tongyi Qianwen LICENSE AGREEMENT 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Qwen-7B-Chat

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
8K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2023-08-03
模型文件大小
15.4GB
MoE架构
总参数 / 激活参数
70亿 / 不涉及
知识截止
暂无数据
Qwen-7B-Chat

开源和体验地址

预训练权重开源
在线体验
暂无在线体验地址
Qwen-7B-Chat

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客
Qwen-7B-Chat

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Qwen-7B-Chat

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Qwen-7B-Chat

发布机构

Qwen-7B-Chat

模型解读

通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。


Qwen-7B-Chat是在在Qwen-7B的基础上,使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。


通义千问的评测效果也很好,超过了LLaMA2:


ModelMMLUC-EvalGSM8KHumanEvalWMT22 (en-zh)
LLaMA-7B35.1-11.010.58.7
LLaMA 2-7B45.3-14.612.817.9
Baichuan-7B42.342.89.79.226.6
ChatGLM2-6B47.951.732.49.2-
InternLM-7B51.052.831.210.414.8
Baichuan-13B51.653.626.612.830.0
LLaMA-13B46.935.517.815.812.0
LLaMA 2-13B54.8-28.718.324.2
ChatGLM2-12B56.261.640.9--
Qwen-7B56.759.651.624.430.6


从上图的评测中可以看到,阿里通义千问在MMLU得分第一,超过了LLaMA2系列模型,而其他方面的得分也很高。最重要的是这个模型中文支持良好,开源免费商用!


Qwen-7B-Chat版本的基础模型是Qwen-7B,模型信息卡: https://www.datalearner.com/ai-models/pretrained-models/Qwen-7B 

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码