DataLearner logoDataLearnerAI
AI Tech Blogs
Leaderboards
Benchmarks
Models
Resources
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Page navigation
目录
Model catalogStarCoder
ST

StarCoder

StarCoder

Release date: 2023-05-05更新于: 2023-07-08 08:45:54.122634
Live demoGitHubHugging Face
Parameters
155.0亿
Context length
2K
Chinese support
Not supported
Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Model basics

Reasoning traces
Not supported
Context length
2K tokens
Max output length
No data
Model type
编程大模型
Release date
2023-05-05
Model file size
64GB
MoE architecture
No
Total params / Active params
155.0B / N/A
Knowledge cutoff
No data
Inference modes
No mode data

Open source & experience

Code license
Apache 2.0
Weights license
BigCode OpenRAIL-M v1- 免费商用授权
GitHub repo
https://github.com/bigcode-project/starcoder/tree/main
Hugging Face
https://huggingface.co/bigcode/starcoder
Live demo
No live demo

Official resources

Paper
Star Coder: May the Source be With You!
DataLearnerAI blog
No blog post yet

API details

API speed
No data
No public API pricing yet.

Benchmark Scores

No benchmark data to show.

Publisher

BigCode
BigCode
View publisher details

Model Overview

💫 StarCoder是一种基于源代码和自然语言文本训练的语言模型(LM)。它的训练数据包含了80多种不同的编程语言,以及从GitHub问题和提交以及notebook中提取的文本数据。


StarCoder简介


StarCoder是基于GitHub数据训练的一个代码补全大模型。可以实现一个方法或者补全一行代码。模型训练的数据来自Stack v1.2,这是一个收集自GitHub的包含很多代码的数据集。StarCoder的context长度是8192个tokens。


需要注意的是,这个模型不是一个指令模型(instruction model),因此,如果你输入“写一个求平方根的方法”这样的文本是无法获得正确结果的。它所做的主要是代码补全。不过,你也可以使用Tech Assistant prompt来让它有类似的能力。这是一个可以让StarCoder变成类似助理的数据集。


StarCoder使用方法

StarCoder生成代码实例


# pip install -q transformers

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码