Qwen-1.8B
Qwen-1.8B
模型参数
18.0亿
上下文长度
8K
中文支持
支持
推理能力
模型基本信息
推理过程
不支持
上下文长度
8K tokens
最大输出长度
暂无数据
模型类型
暂无数据
发布时间
2023-11-30
模型文件大小
3.6GB
MoE架构
否
总参数 / 激活参数
18.0 亿 / 不涉及
知识截止
暂无数据
推理模式
暂无模式数据
开源和体验地址
预训练权重开源
GitHub 源码
Hugging Face
在线体验
暂无在线体验地址
官方介绍与博客
DataLearnerAI博客
暂无介绍博客
API接口信息
接口速度
暂无数据
暂无公开的 API 定价信息。
评测得分
当前尚无可展示的评测数据。
发布机构
阿里巴巴
查看发布机构详情 模型解读
阿里巴巴达摩院开源的18亿参数规模的大语言模型。
Qwen-1.8B模型是基座模型,阿里巴巴还开源了对齐后的聊天优化版本的Qwen-1.8B-Chat以及量化版本。具体的模型如下:
Qwen-1.8B基座模型: https://huggingface.co/Qwen/Qwen-1_8B
Qwen-1.8B-Chat的聊天的对齐优化模型: https://huggingface.co/Qwen/Qwen-1_8B
Int8量化版本的对齐优化模型Qwen-1.8B-Chat-Int8: https://huggingface.co/Qwen/Qwen-1_8B-Chat-Int8
Int4量化版本的对齐优化模型Qwen-1.8B-Chat-Int4: https://huggingface.co/Qwen/Qwen-1_8B-Chat-Int4
关于模型的介绍参考: https://www.datalearner.com/blog/1051701271552217
Qwen-1.8B模型的评测结果如下:
MMLU评测结果:
| Model | Avg. |
|---|---|
| GPT-Neo-1.3B | 24.6 |
| OPT-1.3B | 25.1 |
| Pythia-1B | 26.6 |
| Bloom-1.1B | 26.7 |
| Bloom-1.7B | 27.7 |
| Bloomz-1.7B | 30.7 |
| Bloomz-3B | 33.3 |
| Qwen-1.8B | 45.3 |
Qwen-1.8B模型的代码评测结果(HumanEval):
| Model | Pass@1 |
|---|---|
| GPT-Neo-1.3B | 3.66 |
| GPT-Neo-2.7B | 7.93 |
| Pythia-1B | 3.67 |
| Pythia-2.8B | 5.49 |
| Bloom-1.1B | 2.48 |
| Bloom-1.7B | 4.03 |
| Bloom-3B | 6.48 |
| Bloomz-1.7B | 4.38 |
| Bloomz-3B | 6.71 |
| Qwen-1.8B | 15.2 |
Qwen-1.8B模型的数学评测(GSM8K):
| Model | Acc. |
|---|---|
| GPT-Neo-1.3B | 1.97 |
| GPT-Neo-2.7B | 1.74 |
| Pythia-1B | 2.20 |
| Pythia-2.8B | 3.11 |
| Openllama-3B | 3.11 |
| Bloom-1.1B | 1.82 |
| Bloom-1.7B | 2.05 |
| Bloom-3B | 1.82 |
| Bloomz-1.7B | 2.05 |
| Bloomz-3B | 3.03 |
| Qwen-1.8B | 32.3 |
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
