XVERSE-13B
XVERSE-13B
模型参数
130.0亿
上下文长度
8K
中文支持
支持
推理能力
模型基本信息
推理过程
不支持
上下文长度
8K tokens
最大输出长度
暂无数据
模型类型
暂无数据
发布时间
2023-08-06
模型文件大小
27.52GB
MoE架构
否
总参数 / 激活参数
130.0 亿 / 不涉及
知识截止
暂无数据
推理模式
暂无模式数据
开源和体验地址
官方介绍与博客
官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客
API接口信息
接口速度
暂无数据
暂无公开的 API 定价信息。
评测得分
当前尚无可展示的评测数据。
发布机构
元象XVERSE
查看发布机构详情 模型解读
元象科技开源的大语言模型,免费商用授权,XVERSE-13B一个重要的特点是多语种的支持,官方说明它是在多样化的数据上对模型进行充分训练,包含中、英、俄、西等 40 多种语言,评测结果中对于中文和英文的支持非常优秀,英文的理解水平超过Baichuan-13B,与ChatGLM2-12B持平(MMLU),中文水平也是如此(C-Eval)评价。
评测结果如下:
| 模型数据集 | MMLU | C-Eval | AGIEval1 | GAOKAO-Bench1 | GAOKAO-English1 |
|---|---|---|---|---|---|
| Baichuan-13B | 51.62 | 53.63 | 40.5 | 45.9 | 56.9 |
| Llama-1-13B | 46.94 | 28.8 | 27.3 | 26.4 | 38.1 |
| Llama-2-13B | 54.84 | 35.6 | 33.4 | 35.4 | 60.6 |
| moss-moon-003-base (16B) | 24.7 | 33.13 | 26.8 | 28.5 | 34.7 |
| OpenLLaMA-13B | 42.4 | 24.7 | 24.0 | 25.6 | 33.3 |
| OPT-13B | 25.2 | 25.0 | 24.2 | 24.4 | 31.1 |
| Pythia-12B | 25.1 | 26.2 | 25.3 | 25.3 | 26.8 |
| Ziya-LLaMA-13B-Pretrain-v1 | 43.9 | 30.2 | 27.2 | 26.4 | 37.6 |
| XVERSE-13B | 55.1 | 54.7 | 41.4 | 53.9 | 66.5 |
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
