CodeGeeX2-6B - CodeGeeX2-6B

模型详细情况和参数

CodeGeeX2-6B

模型全称
CodeGeeX2-6B
模型简称
CodeGeeX2-6B
模型类型
编程大模型
发布日期
2023-07-25
预训练文件大小
12.5GB
是否支持中文(中文优化)
最高支持的上下文长度
8K
模型参数数量(亿)
60.0
模型代码开源协议
Apache 2.0
预训练结果开源商用情况
CodeGeeX2-MODEL-LICENSE - 收费商用授权
在线演示地址
暂无
DataLearnerAI的模型介绍
基础模型
发布机构

CodeGeeX2-6B 简介

智谱AI发布的基于ChatGLM2-6B微调的编程大模型。详情参考: https://www.datalearner.com/blog/1051690265117179 


CodeGeeX2 是多语言代码生成模型 CodeGeeX 的第二代模型。不同于一代 CodeGeeX(完全在国产华为昇腾芯片平台训练) ,CodeGeeX2 是基于 ChatGLM2 架构加入代码预训练实现,得益于 ChatGLM2 的更优性能,CodeGeeX2 在多项指标上取得性能提升(+107% > CodeGeeX;仅60亿参数即超过150亿参数的 StarCoder-15B 近10%),更多特性包括:

  • 更强大的代码能力:基于 ChatGLM2-6B 基座语言模型,CodeGeeX2-6B 进一步经过了 600B 代码数据预训练,相比一代模型,在代码能力上全面提升,HumanEval-X 评测集的六种编程语言均大幅提升 (Python +57%, C++ +71%, Java +54%, JavaScript +83%, Go +56%, Rust +321%),在Python上达到 35.9% 的 Pass@1 一次通过率,超越规模更大的 StarCoder-15B。
  • 更优秀的模型特性:继承 ChatGLM2-6B 模型特性,CodeGeeX2-6B 更好支持中英文输入,支持最大 8192 序列长度,推理速度较一代 CodeGeeX-13B 大幅提升,量化后仅需6GB显存即可运行,支持轻量级本地化部署。
  • 更全面的AI编程助手:CodeGeeX插件(VS Code, Jetbrains)后端升级,支持超过100种编程语言,新增上下文补全、跨文件补全等实用功能。结合 Ask CodeGeeX 交互式AI编程助手,支持中英文对话解决各种编程问题,包括且不限于代码解释、代码翻译、代码纠错、文档生成等,帮助程序员更高效开发。
  • 更开放的协议:CodeGeeX2-6B 权重对学术研究完全开放,填写登记表申请商业使用。


商用授权申请: https://open.bigmodel.cn/mla/form?mcode=CodeGeeX2-6B 

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

CodeGeeX2-6B所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

CodeGeeX2-6B相关的任务
代码补全

代码补全

Code Completion

35个资源