加载中...
加载中...
Skywork-R1V3-38B
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
Skywork-R1V3-38B 是 Skywork-R1V 系列中最新且功能强大的开源多模态推理模型。该模型基于 InternVL-38B 构建,在多模态和跨学科智能方面取得了显著的进步。通过在后训练阶段采用强化学习 (RL) 算法,R1V3 显著增强了其推理能力,并在多项多模态推理基准测试中达到了开源领域的最新(SOTA)性能。
Skywork-R1V3 是一个先进的开源视觉语言模型(VLM),其核心创新包括:
这些创新实现了广泛的推理泛化,使该模型的强化学习方法能够成功地将数学推理能力扩展到不同的学科领域。此外,本研究还深入探讨了强化学习相关的特定探索,例如课程学习和学习率策略,并对多模态推理进行了更广泛的讨论。更多详细信息,请参阅 [📖 R1V3 Report]。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
