StarCoder - StarCoder

模型详细情况和参数

StarCoder

模型全称
StarCoder
模型简称
StarCoder
模型类型
编程大模型
发布日期
2023-05-05
预训练文件大小
64GB
是否支持中文(中文优化)
最高支持的上下文长度
2K
模型参数数量(亿)
155.0
模型代码开源协议
Apache 2.0
预训练结果开源商用情况
BigCode OpenRAIL-M v1 - 免费商用授权
在线演示地址
暂无
DataLearnerAI的模型介绍
基础模型
无基础模型
发布机构

StarCoder 简介

💫 StarCoder是一种基于源代码和自然语言文本训练的语言模型(LM)。它的训练数据包含了80多种不同的编程语言,以及从GitHub问题和提交以及notebook中提取的文本数据。


StarCoder简介


StarCoder是基于GitHub数据训练的一个代码补全大模型。可以实现一个方法或者补全一行代码。模型训练的数据来自Stack v1.2,这是一个收集自GitHub的包含很多代码的数据集。StarCoder的context长度是8192个tokens。


需要注意的是,这个模型不是一个指令模型(instruction model),因此,如果你输入“写一个求平方根的方法”这样的文本是无法获得正确结果的。它所做的主要是代码补全。不过,你也可以使用Tech Assistant prompt来让它有类似的能力。这是一个可以让StarCoder变成类似助理的数据集。


StarCoder使用方法

StarCoder生成代码实例


# pip install -q transformers
      

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

StarCoder所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

StarCoder相关的任务
代码补全

代码补全

Code Completion

35个资源