标签

「RLVR」相关文章

汇总「RLVR」相关的原创 AI 技术文章与大模型实践笔记,持续更新。

标签:#RLVR
2025年的大模型训练和大模型应用与之前有什么差别?来自前OpenAI研究人员、特斯拉FSD负责人Andrej Karpathy的新洞察:RLVR代替HFRL成为重点投入工作

2025年的大模型训练和大模型应用与之前有什么差别?来自前OpenAI研究人员、特斯拉FSD负责人Andrej Karpathy的新洞察:RLVR代替HFRL成为重点投入工作

昨天,Karpathy 发布了《2025 LLM Year in Review》,对过去一年大模型领域发生的结构性变化进行了深度复盘。在这篇总结中,他不再纠结于具体的模型参数,而是将目光投向了推理范式的演进、Agent 的真实形态以及一种被称为“Vibe Coding”的新型开发模式。

2025/12/20 23:54:0117