加载中...
加载中...
StableVicuna-13B
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
这是第一个通过强化学习从人类反馈中训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本,它是一个指令微调的LLaMA 13b模型。
StableVicuna由StabilityAI发布,完全开源。

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
