QW

Qwen-1.8B

基础大模型Qwen

Qwen-1.8B

发布时间: 2023-11-30更新于: 2023-11-30 16:37:40.975647
模型参数
18亿
上下文长度
8K
中文支持
支持
推理能力

Qwen-1.8B 是由 阿里巴巴 发布的 AI 模型,发布时间为 2023-11-30,定位为 基础大模型,参数规模约为 18亿,上下文长度为 8K,模型文件大小约 3.6GB,采用 Tongyi Qianwen RESEARCH LICENSE AGREEMENT 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Qwen-1.8B

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
8K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2023-11-30
模型文件大小
3.6GB
MoE架构
总参数 / 激活参数
18亿 / 不涉及
知识截止
暂无数据
Qwen-1.8B

开源和体验地址

预训练权重开源
在线体验
暂无在线体验地址
Qwen-1.8B

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
Qwen-1.8B

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Qwen-1.8B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Qwen-1.8B

发布机构

Qwen-1.8B

模型解读

阿里巴巴达摩院开源的18亿参数规模的大语言模型。


Qwen-1.8B模型是基座模型,阿里巴巴还开源了对齐后的聊天优化版本的Qwen-1.8B-Chat以及量化版本。具体的模型如下:


Qwen-1.8B基座模型: https://huggingface.co/Qwen/Qwen-1_8B 

Qwen-1.8B-Chat的聊天的对齐优化模型: https://huggingface.co/Qwen/Qwen-1_8B 

Int8量化版本的对齐优化模型Qwen-1.8B-Chat-Int8: https://huggingface.co/Qwen/Qwen-1_8B-Chat-Int8 

Int4量化版本的对齐优化模型Qwen-1.8B-Chat-Int4:  https://huggingface.co/Qwen/Qwen-1_8B-Chat-Int4 


关于模型的介绍参考: https://www.datalearner.com/blog/1051701271552217 


Qwen-1.8B模型的评测结果如下:


MMLU评测结果:

ModelAvg.
GPT-Neo-1.3B24.6
OPT-1.3B25.1
Pythia-1B26.6
Bloom-1.1B26.7
Bloom-1.7B27.7
Bloomz-1.7B30.7
Bloomz-3B33.3
Qwen-1.8B45.3



Qwen-1.8B模型的代码评测结果(HumanEval):

ModelPass@1
GPT-Neo-1.3B3.66
GPT-Neo-2.7B7.93
Pythia-1B3.67
Pythia-2.8B5.49
Bloom-1.1B2.48
Bloom-1.7B4.03
Bloom-3B6.48
Bloomz-1.7B4.38
Bloomz-3B6.71
Qwen-1.8B15.2



Qwen-1.8B模型的数学评测(GSM8K):

ModelAcc.
GPT-Neo-1.3B1.97
GPT-Neo-2.7B1.74
Pythia-1B2.20
Pythia-2.8B3.11
Openllama-3B3.11
Bloom-1.1B1.82
Bloom-1.7B2.05
Bloom-3B1.82
Bloomz-1.7B2.05
Bloomz-3B3.03
Qwen-1.8B32.3


DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码