DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools
搜索博客
中
EN
加载中...
大模型列表
DeepSeek V3.2-Exp
评测分析
DeepSeek V3.2-Exp 评测详情
以下是 DeepSeek V3.2-Exp 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
DeepSeek V3.2-Exp
评测结果
思考模式
全部
常规
思考
思考模式细分 (2)
全部
默认 (thinking)
thinking
工具使用
全部
使用工具
不使用工具
综合评估
共 1 项评测
评测名称 / 模式
得分
排名/总数
HLE
thinking
使用工具
20.30
64 / 114
常识问答
共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQA
thinking
使用工具
97.10
1 / 45
编程与软件工程
共 1 项评测
评测名称 / 模式
得分
排名/总数
SWE-bench Verified
thinking
使用工具
67.80
52 / 90
AI Agent - 工具使用
共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Bench
thinking
使用工具
37.70
14 / 35
Agent能力评测
共 3 项评测
评测名称 / 模式
得分
排名/总数
Aider-Polyglot
thinking
使用工具
74.50
7 / 26
τ²-Bench
thinking
使用工具
66.70
25 / 39
τ²-Bench - Telecom
thinking
使用工具
34
32 / 33
AI Agent - 信息收集
共 1 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
thinking
使用工具
40.10
29 / 33
与其他模型对比
DeepSeek V3.2-Exp 评测详情 | DataLearnerAI