SWE-bench大模型评测基准介绍:测试大模型在真实软件工程任务中的能力 | DataLearnerAI