Qwen2-57B-A14B - Qwen2-57B-A14B

模型详细情况和参数

Qwen2-57B-A14B

模型全称
Qwen2-57B-A14B
模型简称
Qwen2-57B-A14B
模型类型
基础大模型
发布日期
2024-06-07
预训练文件大小
114GB
是否支持中文(中文优化)
最高支持的上下文长度
128K
模型参数数量(亿)
570.0
模型代码开源协议
Tongyi Qianwen LICENSE AGREEMENT
预训练结果开源商用情况
Apache 2.0 - 免费商用授权
模型GitHub链接
https://github.com/QwenLM/Qwen2
官方博客论文
Hello Qwen2
基础模型
无基础模型
发布机构

Qwen2-57B-A14B 简介

阿里巴巴开源的第二代通义千问系列大模型的混合专家(Mixture of Experts,MoE)版本,总参数规模570亿,推理时使用140亿,在各项评测任务中都超过了当前主流的MoE开源模型。

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

Qwen2-57B-A14B所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

Qwen2-57B-A14B相关的任务
问答系统

问答系统

Question Answering

35个资源