加载中...
加载中...
StableVicuna-13B
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
这是第一个通过强化学习从人类反馈中训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本,它是一个指令微调的LLaMA 13b模型。
StableVicuna由StabilityAI发布,完全开源。

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
