StarCodeBase - StarCodeBase

模型详细情况和参数

StarCodeBase

模型全称
StarCodeBase
模型简称
StarCodeBase
模型类型
编程大模型
发布日期
2023-05-04
预训练文件大小
64
是否支持中文(中文优化)
最高支持的上下文长度
2K
模型参数数量(亿)
155.0
模型代码开源协议
Apache 2.0
预训练结果开源商用情况
BigCode OpenRAIL-M v1 - 免费商用授权
在线演示地址
暂无
DataLearnerAI的模型介绍
基础模型
无基础模型
发布机构

StarCodeBase 简介

StarCodeBase与StarCode一样,都是来自BigCode的开源编程大模型。二者都是GPT-2的架构,唯一的区别是StarCodeBase是在80多种编程语言上训练的,基于1万亿tokens的数据集训练。而StarCode则是前面基础上,继续在350亿的python tokens上训练。



欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

StarCodeBase所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

StarCodeBase相关的任务
代码补全

代码补全

Code Completion

35个资源