标签

「AIME2025」相关文章

汇总「AIME2025」相关的原创 AI 技术文章与大模型实践笔记，持续更新。

标签:#AIME2025

介绍 AIME 2025：评估大型语言模型高级数学推理能力的基准

随着大语言模型（LLM）的发展越来越快，我们需要更好的方法来评估它们到底有多“聪明”，特别是在处理复杂数学问题的时候。AIME 2025 就是这样一个工具，它专门用来测试当前 AI 在高等数学推理方面的真实水平。

2025/06/08 21:00:562,519