加载中...
加载中...
CodeGemma-7B-IT
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
CodeGemma是Google开源的一系列编程大模型,分为三个版本,CodeGemma-7B、CodeGemma-7B-IT和CodeGemma-2B,第一个模型也成为Gemma-7B-PT,这里的PT代表的是PyTorch,IT代表Instruct,做过指令微调。
CodeGemma-7B-IT是基于Gemma-7B模型继续在代码数据集上训练得到的(新的数据包含5000亿tokens,有代码数据集、开源数学数据集以及合成数据),同时也做过指令优化,相比较非指令优化的CodeGemma-7B,它的代码能力更强!其相关信息如下:
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
