XVERSE-13B

Name: XVERSE-13B
Author: 元象XVERSE

基础大模型XVERSE

XVERSE-13B

发布时间: 2023-08-06更新于: 2023-08-14 09:46:33.103508

在线体验GitHub Hugging Face Compare

模型参数

130亿

上下文长度

中文支持

支持

推理能力

XVERSE-13B 是由元象XVERSE 发布的 AI 模型，发布时间为 2023-08-06，定位为基础大模型，参数规模约为 130亿，上下文长度为 8K，模型文件大小约 27.52GB，采用 XVERSE-13B MODEL LICENSE 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

XVERSE-13B

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

8K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

暂无数据

发布时间

2023-08-06

模型文件大小

27.52GB

MoE架构

否

总参数 / 激活参数

130亿 / 不涉及

知识截止

暂无数据

XVERSE-13B

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

XVERSE-13B MODEL LICENSE- 免费商用授权

GitHub 源码

https://github.com/xverse-ai/XVERSE-13B

Hugging Face

https://huggingface.co/xverse/XVERSE-13B

在线体验

暂无在线体验地址

XVERSE-13B

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

暂无介绍博客

XVERSE-13B

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

XVERSE-13B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

XVERSE-13B

发布机构

元象XVERSE

查看发布机构详情

XVERSE-13B

模型解读

元象科技开源的大语言模型，免费商用授权，XVERSE-13B一个重要的特点是多语种的支持，官方说明它是在多样化的数据上对模型进行充分训练，包含中、英、俄、西等 40 多种语言，评测结果中对于中文和英文的支持非常优秀，英文的理解水平超过Baichuan-13B，与ChatGLM2-12B持平（MMLU），中文水平也是如此（C-Eval）评价。

评测结果如下：

模型数据集	MMLU	C-Eval	AGIEval¹	GAOKAO-Bench¹	GAOKAO-English¹
Baichuan-13B	51.6²	53.6³	40.5	45.9	56.9
Llama-1-13B	46.9⁴	28.8	27.3	26.4	38.1
Llama-2-13B	54.8⁴	35.6	33.4	35.4	60.6
moss-moon-003-base (16B)	24.7	33.1³	26.8	28.5	34.7
OpenLLaMA-13B	42.4	24.7	24.0	25.6	33.3
OPT-13B	25.2	25.0	24.2	24.4	31.1
Pythia-12B	25.1	26.2	25.3	25.3	26.8
Ziya-LLaMA-13B-Pretrain-v1	43.9	30.2	27.2	26.4	37.6
XVERSE-13B	55.1	54.7	41.4	53.9	66.5

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送